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本 书 是 在 波 七 顿 马 萨 诸 塞 大 学 数据 库 人 门 和 提高 等 .系列 教材 的 基础 上 写成 的 ， 从 
理论 和 和 实际 两 方面 详细 介绍 了 了 数据库 的 设计 和 实现 ， 本 书 把 重点 让 在 对 和 象 - 关系 模型 上 ， 
介绍 了 ORACLE、DB2 和 INFORMIX 系 统 中 普 般 采用 的 新 概 您 ， 并 在 络 台 数据 库 的 基本 
原理 和 主要 的 商业 数据 库 产 如 的 基础 上 介绍 了 SQL-99。 本 书 颜 盖 了 关系 数据 库 理 论 、 
SQL 语言 、 数 据 库 设计 以 及 数据 库 完 整 性 、 视 图 、 安 生性、 索引 、 事 务 管 理 竺 各 个 方面 
的 内 容 。 

本 书 是 计算 机 专业 学 生 的 -本 理想 教材 ， 对 于 数据 库 设 计 者 和 实现 者 也 是 一 -本 优秀 
的 参考 书 ，。 
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出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 本 规范 ， 使 西方 固 家 在 自然 科学 的 各 
个 领域 取得 了 垄断 性 的 优 热 ， 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 家 非 
出 、 独 领 风 骆 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 .与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 学 科 中 
的 许 才 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 玖 划 了 研究 
的 范畴 ， 还 揭 药 了 学 术 的 源 变 ， 既 遵 符 学 术 规范 ， 叉 自 有 学 者 个 性 ， 其 价值 并 不 会 因 年 月 的 流 
逝 而 减退 。 

近年 ， 在 全 球 仿 息 化 大 潮 的 排 动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 益 
人 迫切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 通 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 上 时 
得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 得、 从 业 人 员 较 少 的 现状 下 ， 美国 等 发 达 国 家 在 其 计 
算 机 科学 发 展 的 几 十 年 间 积 淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 - 批 国 外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接 软 、 建 设 真 下 的 世 
界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 图 文 信息 有 限 公司 较 早 意识 到 “出 版 要 为 教育 服务 - 自 1998 年 始 ， 华 
章 公 司 就 将 工作 重点 放 在 了 址 选 、 移 译 国外 优秀 教材 上 F。 经 过 几 年 的 不 多 努力 ， 我 们 与 Prentice 
Hall，Addison-Wesley，McGraw-Hill，Morgan Kaufmann 等 世界 着 名 出版 公司 建立 了 良好 的 合作 
关系 ， 从 它们 现 有 的 数 吾 种 教材 中 于 选 出 Tanenbaum，Stroustrmmp，Kemighan，Jim Gray 等 大 师 名 
家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 从 书 ” 为 总 称 出 版 ， 殿 读者 学 习 、 研 究 此 庚 藏 。 大 理 石 纹 
埋 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 丛书” 的 出 版 4. 作 得 到 了 国内 外 学 者 的 瑞 力 襄 助 ， 国 内 的 专家 不 仅 提 供 了 中 肯 
的 选 题 指导 ， 还 不 酬劳 背地 担任 了 狠 译 种 审 校 的 士 作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 中 国 
的 传播 ， 有 的 还 专 诚 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 百 个 品种 ， 
这 些 书 籍 在 读者 中 树立 了 和 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 ， 为 进一步 推 
广 与 发 展 打 下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 
都 步 人 一 个 新 的 阶段 。 为 此 ， 华 章 公 司 将 加 大 引进 教 材 的 力度 .在 “华章 教育 ”的 总 规划 之 下 
出 版 三 个 系列 的 计算 机 教材 ， 针 对 本 科 生 的 核心 课程 ， 划 所 外 版 戎 华 而 成 “国外 经 典 教材 ” 系 
列 ， 对 影印 版 的 教材 ， 则 单独 开辟 出 “经 典 原版 书库 ”; 定位 在 高 级 教程 和 专业 参考 的 “计算 
机 科学 从 节 ” 还 将 保持 原来 的 风格 ， 继 续 出 版 新 的 品种 。 为 了 保 证 这 三 套 从 书 的 权威 性 ， 同 时 
也 为 了 更 好 地 为 学 校 和 老师 们 服务 ， 华 章 公司 聘请 了 中 国 科学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 
科技 大 学 、 复 日 大 学 、 上 海 交 通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科技 大 学 、 哈 尔 滨 工业 大 学 、 
西安 交通 大 学 、 中 国人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮 电大 学 、 中 山大 学 、 解 放 军 理工 大 
学 、 郑 州 大 学 、 湖 北 工 学 院 、 中 国 国家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计 
算 机 的 各 个 领域 的 车 名 学 者 组 成 “专家 指导 委员 会 ”"， 为 我 们 提供 选 题 意 见 利 出 版 监督 。 

“国外 经 典 教 材 ” 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 本 科教 学 


TY 


度 身 订 造 的 。 在 广泛 地 征求 并 听取 从 书 的 “专家 指导 委员 会 ”的 意见 后 ,我 们 最 终 选 定 了 这 20 
多 种 篇 幅 内 容 适 度 、 讲 解 灯 和 尽 人 里 的 教材 ， 其 中 的 大 部 分 已 经 被 MLT.、Stanford、U.C. Berkley、 
C.M.U. 等 世界 名 牌 大 学 采用 。 从 书 不 仅 涵盖 了 程序 设计 、 数 据 结构 、 操 作 和 系统、 计算机 体系 结 
构 、 数 据 库 、 编 译 原 理 、 软 件 工程 、 图 形 学 、 通 信 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普 
裔 开设 的 核心 课程 ， 而 且 各 具 特 色 一 一 有 的 出 自 诸 言 设计 者 之 手 、 有 的 历 三 十 年 而 不 衰 、， 有 的 
已 被 全 世界 的 几 百 所 高 校 薪 用。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科 
学 的 宫殿 中 由 登 笃 而 人 室 。 

权威 的 作者 、 经 典 的 教材 、 一流 的 至 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因 素 使 我 们 的 图 
书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重 
要 帮助 。 教材 的 出 版 只 是 我 们 的 后 续 服 务 的 起 点 。 华 章 公 司 欢迎 老师 和 读者 对 我 们 的 工作 提出 
建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 
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本 书 是 一 本 出 色 的 关于 数据 库 原 理 与 应 用 的 教材 . 它 是 作者 在 波士顿 号 萨 诸 塞 大 学 的 数 
据 库 人 门 和 提高 这 两 门 课 程 教材 的 基础 上 编 篆 而 成 的 。 和 其 他 数据 库 系 统 教材 不 同 ， 本 书 理 
论 与 实践 并 重 ， 每 一 部 分 都 从 基本 概念 人 手 。 并 详细 地 闸 述 各 个 概念 在 真实 的 数据 库 系 统 中 
的 实现 与 应 用 。 同 时 ， 书 中 详细 比较 了 各 种 数据 库 管 理 系 统 的 技术 益 异 ， 并 在 附录 A 中 给 出 了 
丙种 数据 库 管 理 系统 的 使 用 方法 。 于 是 ， 学 生 可 以 在 学 习 了 数据 库 系 统 的 基本 原理 之 后 快速 
地 运用 所 学 的 知识 。 这 种 对 实践 的 重视 同样 体现 在 习题 的 设计 中 。 作 为 一 本 教材 ， 本 书 在 详 
细 介 绍 了 数据 库 经 典 技 术 的 同时 准确 地 把 握 了 数据 库 系 统 的 发 展 趋势 ， 痢 重 介绍 对 象 -关系 模 
型 。 于 是 ,在 阅读 本 书 以 后 ,， 污 者 可 以 很 容易 地 充分 利用 现 有 主流 数据 库 管理 系统 提供 的 主 
要 功能 ， 

本 书 的 作者 Patrick O Neil 和 Elizabeth O’Neil 教 授 都 是 数据 库 界 知名 的 学 站。 他 们 在 数据 
库 领 域 有 很 多 重要 的 研究 成 果 ， 其 中 部 分 成 果 也 被 编 人 本 - 蔬 。 作 者 波 士 帆 马萨诸塞 大 学 的 计 
算 机 科学 教授 ， 他 们 在 这 本 书 中 融入 了 凶 午 的 教学 经 验 ; 同时 ， 由 于 和 工业 界 有 着 紧密 的 联 
系 ， 他 们 在 撰 与 本 书 时 非常 注意 理论 和 实践 相 络 合 ， 并 准确 地 把 握 了 数据 库 系 统 的 发 展 趋势 。 
组 绍 严 递 ， 注 重 实践 、 内 容 新 轩 是 本 书 的 三 大 特色 。 

本 上 书 共 分 11 章 和 4 个 附录 ， 依 次 为 : 第 1 章 数据 库 概 论 ， 第 2 章 关 系 模型 ， 第 3 章 基 本 SQEL 
查询 语言 ， 第 4 章 对 象 -关系 SQL， 第 5 章 访 问 数 据 库 的 程序 ， 第 6 章 数 据 库 设计 ,第 7 章 完 整 性 、 
视图 、 安 全 性 和 目录 ， 第 8 章 索 引 ， 第 9 章 查 询 处 理 ， 第 10 章 更 新 事务 ， 第 11 章 并 行 和 分 布 式 
数据 库 ， 附 录 A 教 学 指导 .附录 了 编程 细节 ， 附 录 CSQL 放 法， 附录 D 集 合 得 询 计 数 ， 最 后 ， 作 
者 还 给 出 了 部 分 习题 的 解答 。 

参加 本 书 翻 译 的 人 员 有 : 阁 侈 英 、 前 荣华 、 季 文 芍 、 钱 卫 宁 、 贺 奇 、 庚 村 奇 、 十 嵌 、 沽 
仁 多 、 钱 海 苗 、 张 龙 、 魏 区 、 范 昱 、 前 江 滔 。 全 书 由 周 傲 英 审 校 ， 

限于 详 者 水 平 ， 着 有 玻 庙 ， 散 请 读者 批评 指正 ， 


详 者 
豆 大 学 计算 机 系 
2001 年 6 月 
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局 傲 英 计算 机 软件 教授 、 博 士 生 导 师 ， 复旦 大 学 计算 机 系 主 任 。1993 年 获 博士 学 位 。 
现任 中 国 计 算 机 党 会 理事 、 数 据 库 专业 委员 会 委员 、 上 海 计 算 机 学 会 数据 库 专 业 委 员 会 副 主 
任 。 近 年 来 ， 曾 先后 担任 PAKDD， DAEAA 等 国际 学 术 会 议程 序 委 员 会 委员 和 WAIM'2000 的 
程序 委员 会 主席 ， 目 前 WAIM 已 成 为 在 中 国 召 开 的 一 个 系列 的 国际 数据 库 学 术 会 议 。 周 葬身 
作为 发 起 人 之 -担任 会 议 顾问 委员 会 成 员 。 作 为 项 目 抽 责 人 或 主要 研究 人 员 主持 或 参加 了 国 
家 973 计 划 、863 计 划 、 国 家 自然 科学 基金 、 国 家 博士 点 基金 、 国 防 科 工 委 预 研 计划 、 上 海 市 
科技 发 展 基 金 及 对 外 合作 项 上 自 的 多 项 研究 和 开发 工作 ， 取 得 一 系列 成 果 ， 先 后 四 次 获 上 海 市 
和 国家 教委 科技 进步 奖 。 近 五 年 来 发 表 了 一 批 遍 水 平 论 文 以 及 出 版 教材 /著作 五 本 。1995 年 人 
选 上 海 市 青年 科技 后 明星 计划 ，19937 年 获 上 海 吝 校 优秀 青年 教师 荣誉 称号 ，2000 年 获得 国务 
院 特 殊 津 贴 ，2000 年 人 选 教育 部 “ 蜂 世 纪 优 秀 人 才 培 养 计 划 ”。 

俞 荣华 ”硕士 研究 生 。 专 业 为 计算 机 软件 与 理论 ， 赋 究 方 向 为 数据 质量 和 数据 清洗 。 


季 文 次 ”博士 研究 生 。 主 要 研究 方向 为 数据 库 和 Web 数 据 管 理 。 
钱 卫 了 ”博士 生 。 专 业 为 计算 机 软件 与 理论 ， 研 究 兴 趣 为 数据 挖掘 和 Web 控 据 。 


序 


从 1994 年 问世 开始 ，O' Neil 的 数据 库 书籍 就 已 经 成 为 学 习 、 设 计 或 管理 关系 数据 库 的 标 
淮 教材 和 参考 书 。 本 书 从 理论 和 实践 两 方面 详细 介绍 了 数据 库 的 设计 和 实现 ， 包 括 关 系 理论 ， 
数据 库 设 计 ， 数 据 库 的 实现 以 及 性 能 优化 等 问题 。 本 书 在 介绍 时 , 先 给 出 - 般 的 概念 ,然后 结合 
实际 数据 库 系 统 中 的 具 居 例子 如 以 说 明 。 

第 2 版 反映 了 自 第 1 版 发 行 后 的 六 年 里 数据 库 领 域 取 得 的 实质 性 进展 .本 书 把 重点 放 在 对 
象 -关系 模型 ;介绍 了 在 Oracle、DB2 和 lnformix 系 统 中 普遍 采用 的 新 概念 ;更 新 了 对 陋 离 技术 的 
表述 方式 。 用 最 新 的 方法 所 出 性 能 的 问题 。 对 象 -关系 的 介绍 是 本 书 的 重点 :这 被 认为 是 SQL 
数据 库 语 言 自 最 初 标准 问世 以 来 发 生 的 最 重要 的 变化 。 丁 书 介 绍 了 SQL-99 的 设计 以 及 SQL-99 
与 基本 怪 理 帮主 要 的 商用 数据 库 的 关系 - 

Pat 教 授 和 Elizabeth O'Neil 教授 对 数据 库 设 计 问题 有 着 广博 而 精深 的 见解 ,在 这 去 的 三 十 年 
中 ,他 们 在 数据 库 领 域 做 出 了 卓越 的 贡献 。 他 们 桃李 满 大 下 ， 发 表 了 很 多 基础 研究 的 论文 ， 并 
与 厂商 合作 开发 了 一 些 数据 库 产 品 。 他 们 不 断 创 新 一 一 在 本 书 中 ,他 们 就 试图 用 统一 的 眼光 来 
看待 数据 库 领 域 中 许多 完全 不 同 的 概念 和 趋势 。 第 2 版 提出 一 种 全 新 的 见解 。 

《数据 库 诛 理 、 编 程 与 性 能 》 对 初学 者 来 说 是 一 本 极 好 的 教材 ， 对 我 们 这 些 不 注意 数据 库 
领域 最 新 动态 的 人 来 说 则 是 易于 说 读 的 最 新 动态 资料 ， 而 对 需要 接受 适时 教育 的 数据 库 没 计 
者 和 实现 者 米 说 ,这 又 是 一 本 不 可 多 得 的 参考 书 . 


Jim Gray 


Microsoft Research 


前 ” 言 


本 书 第 1 版 介绍 了 数据 库 理 论 的 基本 原理 ,探讨 了 理论 和 商业 应 用 之 间 的 联系 和 和 裂缝。 笔者 
认为 有 必要 让 污 者 了 解 最 新 的 数据 库 应 用 情况 ,因为 在 过 去 的 五 年 中 ,各 种 商业 数据 库 产品 都 发 
生 了 巨 关 的 变化 。 开 是 数据 库 领 域 的 这 些 重要 的 变 北 促使 我 们 出 版 了 第 2 版 ， 但 力求 保持 对 原 
书 基本 目标 的 追求 。 

在 第 1 版 中 ,我 们 介绍 了 最 新 的 SQL 和 商业 数据 库 系统 中 的 应 用 程序 。 本 书 广泛 适用 于 交互 
式 SQL 用 户 、 应 用 软件 程序 员 、 数 据 库 管 理 员 和 对 数据 库 感 兴趣 的 学 生 。 在 第 2 版 中 ,我 们 进 一 
步 加 强 了 实际 应 用 与 理论 基础 之 间 的 联系 。 

一 般 的 书 往 往 只 简单 罗列 了 世人 式 SQEL 的 特性 ,不 能 满足 程序 员 编 写 复 杂 数 据 库 应 用 软 
件 的 需要 。 厂 商 的 手册 能 对 SQL 和 数据 库 编 程 进行 很 好 的 介绍 ,但 缺乏 学 生 和 专业 人 员 适 应 
数据 库 系 统 和 语言 变化 所 需 的 基础 理论 。 在 许多 介绍 数据 库 的 书籍 或 手册 中 并 未 很 好 地 介绍 
如 下 原理 : 死 锁 终 止 (事务 需要 重 做 ) 隐 含 的 问题 ;实体 -联系 模型 的 建立 和 规范 化 (以 及 数据 库 
设计 到 实际 表 的 转化 ?在 执行 访问 公共 数据 的 事务 时 ， 用 户 的 变 互 问题 (事务 活动 时 进行 区 
蕊 是 危险 的 ) ;索引 和 查询 优化 如 何 影 响 查询 性 能 方面 的 考虑 一 一 个 数据 库 管 理 只 应 该 重 
视 的 问题 ; 等 等 。 

本 书 可 以 看 做 是 - -本 完整 的 技术 导论 ,数据 库 管 理 员 、 应 用 软件 程序 员 和 资 次 的 SQL 用 户 
都 会 需要 它 。 虽 然 数 据 库 管 理 员 要 求 比 应 用 软件 程序 员 了 和解 更 多 的 东西 ,但 是 ,如 果 后 者 对 前 者 
必需 掌握 的 知识 有 一 个 总 体 的 把 握 , 那 么 他 的 工作 会 变 得 更 有 效 。 类 似 的 情 部 也 适用 于 那些 认 
真 的 交互 式 SQL 用 户 。 任何 与 数据 库 相 关 的 工作 人 员 除 了 牢固 掌握 SQL 外 ,还 应 该 了 解数 据 库 
的 还 辑 设计 ， 数 据 的 物理 存储 、 索 引 、 安 全 和 性 能 价格 比 等 方面 的 知识 。 

本 书 的 作者 都 是 计算 机 科学 的 教授 ,在 与 数据 库 公 避 合 作 和 数据 库 应 用 方面 有 着 丰 时 的 经 
验 。 有 兴趣 的 读者 可 以 访问 主页 www.cs.umhb.eduy~pone 让 和 www.cs.umhb.edu/~eoneil 。 


本 书 的 使 用 


本 书 是 在 波士顿 马萨诸塞 大 学 的 数据 库 入 门 和 提高 这 两 门 课程 的 基础 上 写成 的 。 第 一 门 
课程 介绍 数据 库 的 基本 原理 ， 本 书 的 前 六 章 取 自 该 课程 。 第 二 门 课程 介绍 更 高 深 的 数据 库 概 
念 和 性 能 价格 比 的 问题 ， 本 书 第 7 第 10 章 的 内 容 取 自 该 课程 。 

在 学 习 本 书 的 时 候 , 读 者 可 根据 学 习 的 经 验 和 目的 自己 安排 学 习 的 顺序 和 和 重点。 举例 来 说 ， 
有 基础 的 读者 可 以 根据 自己 的 兴趣 从 后 面 的 章节 开始 学 习 ,只 在 需要 的 时 候 查阅 前 六 章 的 内 容 
(图 1 显示 了 各 章 之 问 的 关系 )。 本 书 在 读者 掌握 前 面 的 概念 的 基础 上 才 展 开 新 的 知识 ,所 以 有 经 
蛤 的 读者 可 以 根据 需要 从 适当 的 地 方 学 起 。 

本 书 既 可 用 作 专 旦 人 员 的 参考 书 和 指南 书 ,也 可 用 作 本 科学 生 数 据 库 课 程 一 学 期 或 两 学 期 
的 大 门 教材 。 它 涵盖 了 数据 库 领 域 从 基础 理论 和 基本 概念 到 发 展 前 沿 的 所 有 内 容 。 本 书 将 基 
本 的 SQL 语 言 和 关系 数据 库 基础 放 在 一 起 介绍 。 本 书 的 例子 取 自 ORACLE,INFORMIX 和 DB2 
等 数据 库 ， 我 们 用 它们 解释 概念 ,并 通过 比较 这 些 成 功 系 统 中 采用 的 不 同方 法 阐明 性 能 -价格 


比 问 题 。 每 章 中 的 关键 性 问题 通过 编程 示例 和 习题 得 以 深入 ,书后 的 四 个 附录 提供 了 补充 性 
的 育 景 介绍 ,为 了 方便 目 学 .本 节 最 后 还 提供 了 部 分 习题 的 符 案 ， 


第 1 章 数据 库 妊 沦 
2 
2 旧 关系 全 上 
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mm 第 3 章 站 证 


第 4 章 刘 象 -关系 SQL 第 6 章 数 扫 库 设计 


第 5 章 访问 数据 库 的 程序 第 7 章 完整 性 、 视图、 安全 性 利 目 录 
第 8 音 索引 
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新 增 内 容 讨论 : 对 象 -关系 模型 


自从 本 书 第 1 版 出 版 以 来 ,SQL 语言 增加 了 许多 新 的 特性 。 第 3 章 中 新 增 的 几 节 介绍 了 这 些 
特性 。 从 根本 上 说 ,对 象 -关系 模型 已 经 变 成 新 的 数据 库 标 准 。 所 有 新 的 对 象 - 关 系数 据 库 管 理 
系统 产品 都 向 后 兼容 ,以 便 支持 关系 模型 ， 我 们 认为 这 一 变化 正在 彻底 改变 数据 库 产 业 .。 数 据 
表 的 设计 以 及 利用 SQL 诸 句 访问 数据 的 方法 将 发 生 很 天 变化 。 

对 象 -关系 模型 成 为 主流 的 过 程 是 值得 研究 的 。 INEORMIX 公 司 从 1996 年 收购 Ilustra 产 
品 起 ， 就 普 力 研 究 把 对 象 -关系 特性 融 人 到 INFORMIX 产 品 中 。( Dlustra, 司 来 被 称 做 Montage， 
参见 第 1 版 3.11 节 ， 在 第 2 版 中 ， 我 们 大 大 扩充 了 这 方面 的 内 容 ， 独 立 编 写成 第 4 章 . ) 1997 年 ， 
ORACLE 公 司 推出 的 ORACLE 第 8 版 ， 支 持 一 整套 对 和 象 - 关 系 特性 ， 该 数据 库 被 普 廊 认为 是 具 
有 革命 性 意义 的 产品 。 从 那 时 起 ， 在 数据 库 产业 界 ， 从 关系 模型 到 对 象 -关系 模型 的 转变 就 已 
是 大 势 所 趋 了 。 最 近 ， 一 向 以 民 好 的 对 象 -关系 编程 接口 著称 的 IBM 的 DB2 UDB 开 始 将 对 象 - 
关系 数据 模型 融入 设计 和 交互 层面"。 不幸 的 是 ， 由 于 还 没有 一 个 统一 的 对 稼 -关系 SQL 标 淮 ， 
各 个 产品 在 语法 上 差别 很 大 ， 应 用 程序 不 可 移植 。 所 幸 的 是 ， 经 过 多 条 的 努力 ，ANSI SQL-3 
终于 在 1999 年 发 布 了 对 象 - 关 系数 据 库 的 最 终 标 准 一 一 SQL-990。 

由 于 有 两 种 完全 不 同 的 表述 数据 的 模型 ， 整 个 知识 领域 就 被 分 割 开 来 这 在 教学 上 是 个 
很 大 的 挑战 。 现 在 ， 绝 大 部 分 的 商业 数据 库 软 件 使 用 纯 关 系 模型 。 这 意味 着 如 果 不 仔 细 对 对 
象 -关系 概念 与 关系 概念 吉 以 区 分 ， 用 户 对 前 者 会 产生 混淆 。 和 第 1 版 - 样 ， 在 第 2 版 中 我 们 仍 
然 在 第 2 章 中 介绍 关系 模型 ， 而 仅 在 第 3 章 中 介绍 最 新 的 关系 SQL 的 表现 形式 。 同 时 ， 我 们 扩 
充 了 第 1 版 3.11 节 中 对 象 -关系 领域 的 内 容 ， 单 独 设 为 第 4 章 ， 在 这 一 章 中 ， 我 们 分 别 介 绍 了 


XI 


ORACLE 和 INFORMIX 中 对 象 - 关 系 的 标准 。 因 为 这 两 个 产品 疗 存 在 很 大 闪 异 ,我 们 把 第 4 章 
中 每 一 节 分 成 两 个 部 分 ， 并 行 地 介绍 ORACLE 和 INEFORMIX。 我 们 没有 介绍 DB2 UDB 关 于 对 
象 -关系 的 诸 沙 规则 ， 头 为 在 编 与 第 4 章 的 时 候 ，DB2 对 象 -关系 模型 正 处 于 开发 阶段 。 ， 

在 详细 介绍 了 对 象 - 关 系 的 概念 各 产品 的 使 用 方法 之 后 ， 接 下 去 的 几 音 在 内 容 上 刁 第 4 章 
基本 无 关 。 这 样 做 的 原因 是 : 迄今 为 止 有 些 问题 在 对 象 - 关 系 领域 还 没完 全 搞 明 白 ， 如 第 6 章 
数据 亩 的 逻辑 设计 ; 而 有 些 问 题 看 起 来 与 对 象 -关系 的 概念 【《PLASQL 和 SPL 除 外 ) 无 关 ， 如 第 
10 音 的 更 新 事务 。 -个 专业 大 员 在 仔细 研读 第 4 章 之 后 ， 就 能 用 对 象 -关系 SQL 的 知识 扩充 大 
部 分 后 刍 章 人 节 的 内 容 ; 而 那些 目前 不 与 对 象 - 关系 数据 库 打 交道 的 读 首 ， 可 能 不 想 立 即 接触 这 
些 肉 容 。 共 图 1 中 可 以 看 到 ， 第 4 章 与 后 续 各 章 设 有 前 后 联系 。 各 章 的 内 和 容 相 对 独立 。( 第 7 章 
涉及 对 彰 - 关 系 模式 下 尘 象 日 录 表 的 内 容 , 但 读者 在 学 习 时 可 以 跳 过 这 -- 段 。) 在 下 一 版 中 ， 
对 象 -关系 的 概念 可 能 会 遍布 每 个 章节 ， 因 为 那 时 对 象 -关系 数据 库 将 会 广泛 使 用 ， 不 过 现在 还 
为 时 过 早 。 

在 编 与 第 2 版 的 时 候 ， 我 们 不 得 不 做 一 些 困难 的 选择 ， 最 难 的 蓉 过 十 选择 合适 的 数据 库 产 
品 。 我 们 舍弃 了 面 问 对 象 数据 库 管理 系统 (OODBMS )， 因 为 虽然 面向 对 象 数据 库 的 洪 在 商 
业 价 值 被 一 致 看 好 ， 但 却 从 来 没有 真正 实现 过 。 现 有 的 DDDBMS 产 品 具 是 存在 而 已 ， 虽 然 
Microsoft SQL Server 正 越 来 越 丰 起 大 家 的 注意 ， 我 们 还 是 舍弃 了 对 它 的 介绍 ， 央 为 我 们 的 主 
要 目的 是 介绍 新 的 对 象 -关系 数据 库 产品 的 特性 ， 而 SQL Server 不 文 持 这 些 特 性 。INGRES 系 
统 是 第 1 版 的 重点 内 容 ， 因 为 作 是 校园 中 使 用 最 广泛 的 系统 。 在 第 2 版 中 ， 我 们 删 去 了 这 部 分 
内 容 ， 内 为 许多 流行 的 数据 库 产品 都 提供 了 针对 校园 市 场 的 低 价 版本。 


每 一 章 的 变化 


在 下 向 对 各 章 的 描述 中 ， 我 们 简要 介绍 了 在 第 2 版 中 第 一 次 引用 的 材料 ， 

第 1 章 “” 数 捐 库 概论 。 新 增 了 对 对 象 -关系 模型 的 欣 讨 。 

第 2 音 ”关系 模型 、 除 了 泣 清 第 1 版 的 若干 细节 外 ， 本 章 基 本 上 未 作 改 动 。 我 们 在 第 2、3 
章 中 介绍 关系 模型 ， 从 第 4 草 开 始 介 绍 对 象 -关系 模型 。 

第 3 章 “基本 查 主语 言 SQL。 在 本 版 中 ， 我 们 介绍 了 很 多 SQL 的 新 特性 。3.6 攻 介绍 了 一 
些 班 有 数据 库 产 品 尚 不 支持 的 “高 级 SQL 湛 法 "、 它 包括 INTERSECT[ALL] 和 
EXCEPT[ALL] 操 作 和 新 的 tableref 定 义 (图 3-11), 提供 了 诸如 
[INNERI{LEFTIRIGHTIFULL}LOUTER]] 连 接 和 对 ON 搜索 条 件 的 连接 ， 因 为 没有 
一 个 统一 的 SQL 标 准 ， 本 书 末 用 了 一 种 一 般 的 形式 ， 我们 称 之 为 “基本 SQL ， 
它 提供 被 所 有 的 数据 库 产品 普 亡 采用 的 一 系列 特性 。 

第 4 章 ”对象 -关系 SQL。 这 是 全 新 的 一 章 ， 我 们 列表 说 明 各 节 和 各 小 节 的 主要 内 容 。 每 
节 的 最 后 中 对 ORACLE 和 INFORMIX 的 每 一 个 特性 的 分 别 说 明和 相 五 比较 。 

4.1 引言: 对 象 -关系 数据 库 的 定义 和 历史 。 

4.7ORACLE 中 的 对 象 类 型 ，INFORMIX 中 的 行 类 型 ， 用 对 象 ( 行 ) 类 型 定义 表 ， 
对 象 馈 套 , 访问 到 的 点 标号 ， 半 象 数据 缺乏 封装 ，ORACLE 中 REF 的 介绍 ， 
INFORMIX 中 的 类 型 继 涵 。 

4.3 汇集 (collection) 类 型 。OQRACLE 中 有 两 种 汇集 类 型 : 舰 套 表 ( 表 类 型 的 列 值 ) 和 
VARRAY( 数 组 类 型 的 列 值 )。INFORMIX 有 三 种 汇集 类 型 : 集合 、 多 重 集合 (无 
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序 ,但 允许 有 重 值 ) 和 列表 (有 上 序 )。 这 两 种 数据 库 都 允许 即席 查询 ， 从 汇集 中 检 
索 数 据 ,并 插入 和 更 新 汇集 。 

4.4 用 户 自 定义 函数 (UDF) 和 方法 。ORACLE 支 持 一 种 过 程 性 SQL 语 言 PL1SQL, 太 
INFORMIX 支 持 SPL.， 和 在 这 两 个 数据 库 中 ,UDF 可 以 用 过 程 性 语言 编写 (或 用 一 
种 般 入 式 SQL 诸 言 ,比如 Java}。UDF 也 被 称 为 SQL 中 的 内 秆 晒 数 。 方 法 是 
ORACLE 支持 的 一 种 UDPF， 马 被 定妆 成 对 象 类 型 的 一 部 分 . 

4.5 外 部 阔 数 和 财 户 定义 类 型 包 (UDT)。 我 们 概述 了 数据 库 系统 中 打包 一 组 外 部 
耳 数 的 用 户 定义 类 型 的 功能 。 外 部 孙 数 用 类 CC 语言 编写 并 在 数据 库 服 务 器 上 执 
行 的 UDF。 这 样 一 种 包 在 ORACLE 中 称 为 Catridge， 在 INFORMIX 中 称 为 
DataBlade, 而 在 DB2 UDB 中 称 为 Extender. 


以 下 各 章 的 草 号 比 第 1 版 中 的 相应 章 号 增加 了 1, 因 为 在 第 2 版 中 增加 了 新 的 第 4 章 。 


第 5 章 


第 8 章 


第 9 前 


第 10 章 


第 i1 章 


访问 数据 库 的 程序 。 在 第 2 版 中 ,我 们 提供 了 更 多 的 编程 实例 ,特别 是 关于 事务 方面 
的 。 我 们 改进 了 错误 处 理 的 内 容 。 我 们 介绍 了 最 新 的 ORACLE 语法 .特别 是 
ORACLE 动态 SQL 语法 (包括 SQLSTATE)。 同 时 还 将 介绍 DB2 UDB( 代 替 第 1 版 中 
的 INGRES)。 

数据 库 设 计 。 这 是 指数 据 库 的 逻辑 设计 ,包括 E-R 模 型 和 规范 化 。 本 章 阐 述 了 很 多 
定 尽 和 证 明 , 增 加 了 很 多 实例 说 明 。 

完整 性 、 视 图 、 安 全 性 和 目录 。 本 章 新 介绍 了 大 量 Create Table 和 Alter Table 语 名 
的 标准 子 名 ， 重 写 了 和 触发 咒 部 分 ,其 中 的 例子 来 和 目 于 DRACLE 和 DB2 UDB。 对 可 
更 新 视图 的 限制 的 介绍 变化 较 大 ， 对 查询 视图 不 再 有 任何 限制 。 系 统 目 录 部 分 梢 
有 扩充 ,增添 了 一 小 节 对 但 -关系 目录 的 内 容 。 

索引 。 磁盘 速度 、 容 量 、 价 格 和 内 存 价格 都 已 更 新 。 还 里 新 了 DRACLE 中 Create 
Tablespace 语 句 。 对 INGRES 宗 引 功 能 (SAM、 散 列 等 ) 丰 再 做 专门 介绍 。 新 增 的 
内 容 有 ORACLE 索引 组 织 表 和 表 聚 能 (主要 是 散 列 聚 簇 )。 为 了 处 理 新 的 DRACLE 
散 列 职 徐 结构 ,对 溢出 链接 做 了 一 些 修改 。 新 增 了 DB2 UDB 的 索引 结构 。 

查 章 娃 理 。 昌 然 在 这 一 章 的 前 几 节 中 己 经 介绍 了 新 的 DB2 产 品 的 特性 ， 在 一 些 绅 
阅 者 的 坚持 下 ,本 片 中 我 们 保留 了 第 1 版 介绍 IBM 大 型 机 上 DB2 的 查询 特性 的 内 
容 。 正 是 这 些 特 性 导致 了 集合 查询 基准 测试 的 测试 结果 。 因 为 大 部 分 DB2 查 询 功 
能 仍 代 表 了 当今 的 最 高 技术 ,而 第 1 版 中 对 查询 过 程 的 解释 即使 在 现在 看 来 仍 是 非 
常 详尽 的 ,所 以 这 部 分 内 容 仍 然 用 来 向 学 生 解 释 如 何 完成 查询 的 重要 概念 。 事 实 
上 ， 查询 处 理 器 的 内 容 仍 与 当前 大 型 机 DB2 产 品 (DB2 for QS/390} 有 关 。 

本 章 的 :一 些 定义 和 证明 做 了 较 大 改动 。 在 10.5 节 站 离 层次 定义 中 ,新 增 了 推荐 读物 
[1 中 新 的 研究 成 果 。 

只 做 了 一 些 细微 的 改动 。 


万 维 网 上 的 文 持 


本 书 的 主页 http:Awww.mkp.comyAbooks_catalog/1-55860-438-3.asp 提供 以 下 功能 :链接 作 
省 的 主页 ;提供 为 几 种 数据 库 产品 编写 的 创建 和 载 和 数据库 的 脚本 ; 提供 本 书 最 新 的 勘误 表示 
例 程序 和 讲课 幻 籽 片 ， 为 教师 提供 不 带 黑 点 标记 (，* ) 的 习题 的 管 案 。 读 者 的 建议 、 意 见 和 勘 训 
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第 1 章 数据 库 概论 


本 章 介 绍 本 书 的 主要 思想 和 定义 。 我 们 描述 了 数据 库 的 基本 概念 友 数 据 库 系统 的 典型 用 
户 ， 然 后 概述 与 数据 库 管 理 系统 相关 的 概念 和 特性 。 


1.1 基本 的 数据 库 概念 


数据 库 管 理 系统 一 简称 为 数据 岩 系 统 或 DBMS 一 一 是 一 种 软件 产品 ， 它 把 一 个 企业 的 数 
据 以 记录 的 形式 在 计算 机 中 保存 起 来 。 举 例 来 说 ,批发 商 往往 会 用 -个 数据 库 管 理 系 统 保 存 
销售 记录 ( 交易 的 操作 数据 ) ; 大 学 可 以 用 数据 库 管 理 系统 保存 学 生 的 记录 (学 费 、 成 绩 
等 ) ; 大 部 分 大 型 图 书馆 利用 数据 库 系 统 保 存 藏书 清单 和 出 借 记 录 ， 提 供 主题 、 作 者 和 题目 
等 多 种 类 型 的 索引 ; 所 有 的 航空 公司 都 利用 数据 库 系 统管 理 航 址 和 提供 订 票 服务 ; 州 机 动 千 
管理 部 门 和 用 数据 库 系 统管 理 名 驶 员 质 照 、 登 记 车 辆 。Tower 唱 片 公 司 用 数据 库 系 统 来 管理 库 
存 ， 打 印 所 有 的 磁带 利 CD， 并 为 顾客 提供 查询 唱片 的 功能 。 像 这 样 为 一 个 共同 的 日 的 而 保存 
起 来 的 所 有 数据 的 集 人 台 称 为 数据 库 。 数 据 库 中 的 记录 通常 保存 在 磁盘 上 ( 一 种 在 断 电 时 不 去 
失 保存 信息 的 低速 存 取 介 质 )， 一 般 只 在 访问 时 才 把 记录 从 磁盘 载 人 内 存 。 

一 个 数据 库 管 理 系 统 能 问 时 管理 多 个 数据 库 。 举 例 来 说 ，… 所 大 学 可 能 拥有 一 个 登记 学 
生 的 数据 库 和 一 个 图 书馆 数据 库 。 两 个 数据 库 之 间 没 有 共享 的 数据 【虽然 可 能 有 一 部 分 重复 
信息 ， 因 为 一 部 分 读者 是 学 生 )， 不 同 的 用 户 可 以 通过 同一 个 数据 库 管理 系统 访问 这 两 个 数 
据 库 。 

1. 数据 库 的 历史 

为 了 访问 数据 库 申 的 信息 ， 已 经 开发 出 许多 方法 。 问 顾 历 史 ， 有 两 个 产品 为 组 织 信息 所 
羽 了 两 种 截然 不 同 的 数据 模型 ，1968 千 IBM 发 布 的 MS 和 20 捞 纪 70 年 代 Cullinet Software 的 
IDMS。IMS 提 出 了 不 同类 型 的 记录 通过 层次 结构 相互 联系 的 层次 数 据 模 型 . 例如， 一 -个 雏 行 
数据 库 系 统 可 以 把 公司 实体 记 姑 和 诸如 总 部 地 址 、 电 话 号 码 这 样 的 信息 放 在 层次 结构 的 顶 
部 ; 接 下 来 是 银行 的 各 个 业务 部 门 ; 在 每 个 部 门 分 支 下 ， 是 该 部 门 的 出 纳 员 和 其 他 职员 的 记 
录 。 当 要 查询 某 个 出 纳 员 时 ， 程 序 就 会 沿 着 各 个 分 层 导航 。 另 一 方面 ,在 CODASYL 委 员 会 
数据 库 任 务 组 1971 年 发 表 的 报告 的 基础 上 诞生 和 的 [DMS， 被 称 为 网 状 模 型 。 网 状 模型 是 层次 
模型 的 一 个 推广 ， 某 一 级 的 一 个 记录 集合 在 上 -级 中 可 能 对 应 两 个 不 同 的 包 仿 层次 
( containing hierarchy )。 

当然 ，[MS 和 IDMS 还 有 许多 我 们 没有 提 到 的 特性 。 简 单 地 涪 ， 层 次 模型 把 数据 组 织 成 一 
现实 捞 界 中 的 数据 结构 。 这 些 产 品 的 主要 缺点 是 对 数据 的 查询 很 难 执行 ， - 般 沉 要 熟悉 复杂 
的 数据 导航 结构 的 专业 程序 员 编 写 相 应 程序 。 今 天 ， 仍 然 有 相当 多 的 公司 在 使 用 这 两 种 数据 
库 。IMS 仍 然 是 IBM 重 要 的 利润 来 源 .、 但 是 ， 这 些 使 用 中 的 IMS 和 IDMS 已 经 是 “中 产 系统 ” 
了 ， 而且, 很 难 把 这 些 系统 转化 成 现代 的 数据 模型 。 虽然 某 些 公司 用 原 有 的 系统 已 经 足够 ， 
但 任何 想 安 装 新 系统 的 公司 都 会 选择 一 个 支持 更 新 的 数据 模型 的 数据 库 管 理 系 统 。 





2 。 缆 据 床 原 理 、 轿 得 与 性 能 


2. 关系 模型 和 对 象 -关系 模型 

最 近 18 年 来 ， 数 据 库 系 统 产品 使 用 最 广泛 的 数据 模型 是 关系 模型 。 关 系 模型 使 用 灵活 ， 
即使 用 户 不 是 程序 员 ， 也 可 以 快捷 轻 筋 地 写 出 一 般 的 查询 语句 。 一 个 利用 关系 模型 的 数据 库 
管理 系统 称 为 关系 数据 库 管 理 系统 (RDBMS )。 最 近 几 年 ， 一 种 更 新 的 数据 模型 一 一 对 象 一 关 
系 模 型 在 许多 产品 中 正和 逐渐 取代 关系 模型 。 利 用 对 象 -关系 模型 的 数据 库 管理 系统 称 为 对 象 - 
关系 数据 库 管 理 系 统 {DRDBMS )。 因 为 对 象 -关系 模型 实际 上 是 关系 模型 的 扩展 ， 对 象 - 关 
系数 据 库 管理 系统 也 支持 关系 数据 库 管 理 系 统 中 的 数据 。 因 此 有 些 作 者 将 这 种 产品 作为 
RDBMSVORPBMS 类 型 ， 如 果 我 们 不 愿 区 分 它们 ， 可 笼统 地 称 之 为 数据 库 管 理 系 统 。 

存 本 书 中 ， 我们 将 学 习 一 整套 在 数据 库 管 理 系 统 中 建立 、 维 护 和 使 用 数据 库 的 概念 和 方 
法 。 虽 然 RDPBMS 和 ORDBMS 之 间 存 禁 很 大 差异 ， 本 书 全 面 介 绍 了 几乎 所 有 的 相关 技术 。 因 
为 关系 数据 库 是 最 流行 的 数据 库 ， 所 以 我 们 把 重点 放 在 这 里 。 只 在 第 4 章 中 独立 介绍 了 对 象 - 
关系 数据 库 ， 而 关系 数据 库 的 概念 膏 及 本 书 的 其 余部 分 。 两 种 模型 中 绝 大 多 数 的 新 概念 都 用 
相当 多 的 不 同 种 类 的 商业 数据 库 管理 系统 产品 和 标准 中 欧 具 体 命令 加 以 说 明 。 很 多 针对 复杂 
的 ORDBM3S 特 性 的 命令 语法 随 系统 的 差异 各 不 相同 ， 但 基本 的 RDBMS 的 功能 是 相同 的 。 

3. 涉及 的 数据 库 系 统 

为 了 扩展 知识 覆盖 而 ， 本 广 涉 及 的 商业 数据 库 系统 有 : 

ORACLE Server， 记 作 ORACLE。 运 行 在 几乎 所 有 的 UNIX、Windows NT 和 一 些 较 早 的 

操作 系统 上 。 读 者 可 访问 www.oracle.com 获 取 相 关 信 息 。 

*。 DB2 Universal Database， 记 作 DB2 UDB.。 运行 在 大 多 数 UNIX、Windows NT、DS7A2 和 

OS/390 上 。 相 关 站 点 : www.ibm.com/db2。 
* Informix Dynamic Server 2000， 记 作 INFORMIX， 返 行 在 大 多 数 UNIX、Windows NT 
上 。 相 关 站 点 ; www.informix.com。 

“DB2 for OS/390， 记 作 DB2， 特 指 IBM 主 机 上 的 户 B2 系 统 。 运行 在 OS/390 上 。 机 关中 点 : 

www.libm,convdb2., 

4. 一 个 关系 数据 详 的 例子 

现在 我 们 开始 介绍 一 些 基本 的 概念 。 图 1-1a 显 示 了 一 个 关系 数据 库 的 例子 ， 它 的 内 容 是 
大 学 里 每 个 学 生 的 注册 记录 。 为 了 阐明 概念 ， 这 个 例子 大 大 简化 上 了 上。 实际 上 ， 这 样 一 个 数据 
库 会 有 好 几 万 条 记录 ， 每 条 记录 又 包含 很 多 字段 。 

关系 数据 库 中 ， 所 有 的 信息 被 保存 在 带 名 字 的 表 中 ， 每 个 表 又 由 者 干 条 具有 和 名字 的 列 组 
成 。 拿 上 面 的 例子 来 说 ， 名 为 students 的 表 包 含 以 下 各 列 : sid 代 表 每 个 学 生 唯 一 的 标识 
号 ，l1name 和 ftname 代 表 学 生 的 姓 和 和 名 ;class 代表 年 级 ， 从 1 到 4 分 别 表 示 一 年 级 于 四 年 
级 ; telephone 是 学 生 的 住宅 电话 号 码 。 在 一 个 完整 的 数据 库 中 , 还 应 包括 学 生 的 家 胜地 址 、 
学 费 、GPA 等 内 容 。students 表 中 的 每 一 行 代表 一 个 学 生 的 记录 。 举 例 来 说 ,第 一 行 ( 列 
名 下 面 的 那 一 行 ) 表示 一 个 名 为 Jones 的 二 年 级 学 生 ， 他 的 学 号 为 1， 电 话 导 码 为 555-1234。 虽 
然 很 多 数据 库 专家 强调 表 与 磁盘 文件 间 的 重大 区 别 ， 我 们 还 是 可 以 把 一 张 表 描 广 为 一 个 由 记 
录 《 每 条 记录 代表 一 行 ) 组 成 的 磁盘 文件 。 为 了 更 直观 地 表述 问题 ， 以 下 的 术语 可 互 换 使 用 : 
磁盘 文件 和 表 ， 行 和 记录 ， 列 和 字段 。 

图 1-1a 中 的 courses 表 列 出 了 所 开 的 课程 的 集合 。 其 中 ，cnc 给 出 课程 号 ，cname 给 出 
课程 名 称 ，croom 给 出 上 课 地 点 ，cime 给 出 上 课 日 期 和 时 间 。 其 中 time 列 的 值 是 编码 : 
MW2 才 示 星 拓 -:、 星 期 三 的 第 二 节 有 课 。enrolliment 表 只 有 三 列 ; sid 代 表 学 号 ，cno 民 表 诬 
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么 号 ，major 代 表 这 门 混 是 否 是 这 个 学 生 的 主 修 课 。 例 如 ， 学 号 为 1 的 学 后 有 一 门 主 修 课 是 数 
学 ， 党 号 为 3 的 学 生 主 修一 门 现代 语言 。 图 1-18 的 三 张 表 一 起 组 成 一 个 关系 数据 库 。 注 意 此 处 
表 和 列 的 名 字 都 是 小 写 的 ,在 很 多 其 他 的 文章 里 则 用 大 写 。 
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图 1-la 关系 模式 下 的 学 生 注 册 数据 库 


很 多 以 表 的 形式 表述 数据 的 概念 将 在 第 2 章 中 介绍 ,但 这 里 我 们 先 提 一 个 概念 : 第 一 范式 
规划。 在 关系 模型 里 ， 表 的 每 一 列 只 有 一 个 单一 的 非 铺 构 化 的 值 。 非 结构 化 约束 意味 着 ， 举 
例 来 说 ， 我 们 不 能 把 姓 和 名 这 两 个 可 分 别 没 置 和 检索 的 值 放 到 同一 列 ; 也 就 是 说 ， 我 们 不 能 
创建 一 个 灶 似 已 中 的 结构 或 JAVA 中 的 娄 的 列 { 例如 ， name 列 由 name .ijname 和 name. fname 
组 成 )。 妆 然 ， 我 们 可 以 创建 一 个 只 包含 字符 串 类 型 值 的 name 列 ， 并 用 分 隔 符 连接 姓 和 名 ， 
例如 Allan.Jones， 但 这 是 另 一 回 事 了 。 规 则 要 求 每 一 列 包 含 单一 类 型 的 值 ， 我 们 就 不 能 把 
smnrollment 表 当 作 students 表 中 的 一 个 列 ， 否 则 表 的 每 “: 行 包 售 .个 (cne， major) 
对 的 集合 ， 而 enrollment 表 变 得 多 余 。 这 样 的 列 的 例子 如 图 1-1b 所 示 ， 这 在 关系 数据 库 中 
是 不 允许 的 ,但 可 以 作为 对 象 - 关 系数 据 库 系 统 中 的 一 个 学 生 注 册 数 据 座 ， 

5. 一 个 对 象 - 关 系数 据 库 的 例 于 

在 对 象 -关系 数据 库 中 ， 信 息 仍 然 被 表达 成 由 带 名 字 的 列 组 成 的 带 名 字 的 表 的 形式 。 但 此 
时 ， 列 值 不 诅 爱 第 一 范式 规则 的 约束 。 在 图 1.1b 中 ， 我 们 给 出 了 一 个 与 艾 1-1a 中 的 关系 数据 库 
等 价 的 对 象 - 关 系数 据 库 。 关 系 模 型 有 时 被 称 做 是 “形式 完整 "、“ 位 置 与 值 一 一 对 应 ”的 模型 。 
在 对 象 -关系 模型 中 ， 则 没有 “-- 一 对 应 ” 约 蝎 。 

在 图 1-1b 中 ，stuaents 表 中 的 name 列 用 一 种 新 的 结构 类 型 来 包含 客 个 可 分 别 设 置 和 检 
索 的 成 分 : name ,1name 和 name-fname， 两 者 作为 name 列 的 丁 个 成 分 都 出 现在 父 列 name 
下 。 对 象 -关系 数据 库 还 设 有 一 个 统一 的 标准 ， 所 以 不 同 的 对 象 -关系 数据 库 产 品 文 持 不 同 的 
特性 和 命名 规则 。 在 ORACLE 中 ，name 列 的 结构 类 型 称 为 对 象 类 型 ， 在 INFORMIX 中 称 为 行 
类 型 ,在 DB2 UDB( 和 新 的 ANSI SQL-99 标 准 ) 中 称 为 用 户 定 义 类 型 (UDT)。 
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图 1-lb 对 象 -关系 模式 下 的 学 生 注 册 数 据 库 


图 1-1b 中 students 表 的 每 一 行 的 enrollment 列 值 是 行 类 型 值 的 让 集 。 现 在 来 看 学 生 
1(Allan Jones) 所 在 的 行 ，Jones 选 了 两 门 课 : 非 主 修 课程 101( 在 Jones 的 major 宇 段 中 为 No) 和 十 
修 课 程 108( 在 Jones 的 major 字 段 中 为 Yes)。 问 样 ， 在 不 同 的 产品 中 ， 像 enro1lLment 这 样 包 
富 多 个 结构 化 数据 的 列 有 不 同 的 名 称 。 在 SQL-99 中 ， 这样 的 列 称 做 是 江 集 类 型 的 。 由 于 
students 表 中 的 enrollment 列 包含 了 图 1-1a 中 enrollment 表 的 所 有 信息 ， 所 以 在 图 1- 
1b 中 就 不 青 需 要 enrollment 表 。 


1.2 数据 库 用 户 


DBMS 的 一 个 重要 特性 是 缺乏 经 验 的 用 户 可 以 从 数据 库 中 检索 数据 ， 这 种 类 型 的 用 广 称 
为 “最 终 用 户 ”。 他 们 用 链 盘 输入 查询 语句 ， 要 求 数据 库 把 管 案 输出 到 显示 更 或 打印 出 来 。 便 
如 ,在 Tower 唱 片 公司 ,用户 希 望 通过 一 系列 交互 式 的 菜单 查询 选项 ,找到 需要 的 唱片 。 最 记 ， 
唱片 列表 输出 到 显示 屏 上 ， 同 时 打印 机 也 输出 相关 内 容 来 帮助 用 户 找 到 所 需 唱 片 。 

在 最 终 用 户 可 以 方便 地 访问 数据 库 的 数据 之 前 ， 专 业 人 员 还 需 做 大 量 的 工作 。 与 其 他 的 
软件 不 同 ， 数 据 库 系 统 在 计算 机 平台 上 运行 后 ， 并 不 能 马上 投入 使 用 ， 相关 的 数据 库 还 需要 
设计 和 载 人 数据 (以 后 还 要 不 断 地 更 新 数据 )， 然 后 必须 编写 应 用 程序 为 没有 经 验 的 最 给 用 户 
提供 简单 的 药 单 界面 。 和 做 这 些 工 作 的 专业 人 员 也 可 以 被 认为 是 数据 库 系 统 的 用 户 。 只 有 了 解 
不 同类 型 的 用 户 ， 才 能 设计 上 出 界面 友好 的 数据 库 管 理 系 统 。 专 家 级 用 户 有 责任 为 高 级 用 户 提 
供 一 个 良好 的 环境 。 不 管 哪 类 用 户 都 希望 上 有 有一 个 便于 使 用 的 界面 。 下 库 是 对 各 种 类 型 用 户 的 


描述 : 
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"最终 用 户 一 一 交互 式 用 户 。 
临时 用 户 一 一 用 SQL 访问 PBMS 的 用 户 . 
初级 用 户 一 一 通过 荣 单 沪 问 DBMS 的 用 户 。 

* 上 应 用 程序 员 一 一 编写 菜单 程序 的 程序 员 ，。 

。 数据 库 管 理 员 一 一 管理 DBMS 的 专家 。 

最 终 用 户 临时 用 户 应 该 惟 得 关系 数据 库 标 准 杏 询 诺言 SQL 的 使 用 机 制 。 在 以 后 的 章节 
中 我 们 会 担 到 ， 要 学 会 使 用 SQL 不 是 一 件 简 单 的 事 。 这 里 的 “临时 ” 嘴 指 用 户 经 常 从 一 个 会 
话 到 下 一 个 会 话 改 变 查询 的 得 求 ， 此 时 为 每 个 这 样 的 使 用 编写 基于 菜单 的 应 用 程序 是 不 经 济 
的 。 在 实现 一 些 和 急迫 的 需求 时 配制 的 查询 称 为 京 互 式 查询 或 即席 查询 fad hoc query)- (拉丁 文 
ad hoc 伟 为 “为 了 特殊 的 日 的 "。) 初 组 用户 通过 莱 单 使 用 数据 库 ， 而 不 必 编 与 SQL 语句 。， 银 行 
和 航空 公司 订 票 系统 的 职员 就 是 这 种 初级 用 户 ,， 这 里 用 “初级 ”可 能 会 产生 误解 . 即使 是 精 
通 SQEL 的 数据 库 系 统 的 实现 者 ， 在 维护 软件 的 时 候 ， 也 会 利用 菜单 功能 以 多 种 形式 输出 出 错 
记录 。 这 使 程序 员 能 集中 精力 处 理 真正 的 工作 ， 而 不 必 花 费时 间 编 号 SQL 语 句 。 

应 用 程序 员 。 这 类 用 户 直 接 与 数据 库 管理 系统 打交道 ， 为 初级 用 户 编 写 菜 单程 序 。 这 种 
程序 必须 充分 预见 到 客户 的 需求 ， 在 执行 期 间 提交 相应 的 SQL 语句 从 数据 库 中 检索 所 需 的 售 
县 。 程 厅 员 在 处 型 复杂 的 概念 和 内 难 的 语法 问题 方面 经 验 直 富 ， 把 初级 用 户 的 要 求 转化 为 确 
切 的 查询 语句 是 他 们 的 职责 所 在 。 为 了 更 便于 使 用 ， 程 序 必 须 确保 在 查询 中 没有 任何 细微 的 
错误 。 我 们 将 会 看 到 ， 越 是 复杂 的 SQL 查询 ， 在 构造 即席 模式 时 出 错 的 风险 也 越 大 。 

数据 库 管 理 员 DBMS 的 最 后 一 类 用 户 是 数据 库 管 理 员 (DBA ) DBA 是 负责 设计 和 维 
护 数 据 库 的 计算 机 专家 。 一 般 DBA 决 定 如 何 把 数据 分 解 到 各 个 表 中 、 如 何 创 建 数 据 库 以 及 如 
何 载 人 表 ， 为 了 实现 访问 和 更 新 数据 时 的 各 种 策略 ，DBA 还 要 做 大 量 的 幕后 工作 。 这 些 策略 
包括 安全 性 控制 【例如 用 户 访问 数据 的 权限 ) 和 完整 性 约 东 《〈 例如 储 著 账户 结余 账目 不 得 少 
于 0 元 )。 男 外 ，DBA 还 要 负责 设计 数据 库 在 辅 存 ( 磁盘 ) 中 的 物理 实现 和 有 效 的 索引 结构 来 
获得 最 好 的 性 能 . 

在 本 书 中 ,我 们 的 日 标 是 给 出 成 为 一 个 资深 临时 用 户 、 一 个 好 的 应 用 程序 员 成 者 -- -个 
DBA 所 必须 掌握 的 基本 的 技术 基础 。 一 位 使 用 SQL 的 资深 最 终 用 户 不 -: 定 要 知道 如 何 编程 ， 
但 他 可 以 从 本 书 的 其 他 许 包 内 容 中 受益 。 一 位 硕 级 的 应 用 程序 员 应 该 懂得 所 有 DBA 要 用 到 的 
技术 ， 这 样 才 能 设计 出 高 效 的 程序 ， 才 能 反馈 适当 的 信息 供 PBA 调 斌 系统， 有关 数据 库 管 理 
员 职 责 的 内 容 几 乎 贯穿 伞 书 ， 是 下 面 槛 介绍 的 各 章 的 主题 。DPBA 处 理 一 些 DBEMS 中 最 高 级 的 
特性 。 他 必须 精通 前 台 用 户 的 的 需求 ， 最 好 还 能 了 解 应 用 程序 的 技术 细节 。DBA 所 做 的 决定 
全 在 很 多 方面 影响 这 些 程序 ， 包 括 SQL 语 名 的 格式 和 程序 的 性 能 。 

注意 还 有 一 种 与 数据 库 有 密切 联系 的 专业 人 人 员 ， 称 为 数据 奸 系 统 的 实现 者 。 他 们 是 编写 实 
现 系统 核心 功能 程序 的 系统 程序 员 。DBMS 正 是 通过 这 些 程序 提供 各 种 特性 。 一 些 高 级 数据 库 
教科 书 着 重 介绍 数据 库 的 内 核 。 由 于 数据 库 是 一 个 很 大 的 领域 ， 本 书 着 重 介 绍 一 个 数据 库 系 统 
是 如 何 使 用 的 ， 这 是 着 手 实 现 一 个 系统 前 关键 的 步 绝 。 在 任何 情况 下 ，-… 位 优秀 的 DBA 都 疲 深 
入 了 解 DBMS 的 工作 组 节 。 我 们 会 看 到 ， 这 样 的 细节 在 调试 系统 性 能 的 时 候 是 必 不 可 少 的 。 


1.3 关系 数据 库 管 理 系 统 和 对 象 - 关 系数 据 库 管理 系统 概述 
到 现在 汐止 ， 我 们 只 讨论 了 关系 数据 库 管理 系统 的 一 个 主要 特性 一 一 提交 查询 语句 以 便 从 
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数据 库 中 检索 信息 。 通 常 还 有 很 多 其 他 的 特性 ， 其 中 有 些 专业 性 很 强 ， 如 果 没 有 一 和 让 的 使 用 
经 验 ，、 要 评价 它们 的 价值 是 很 困难 的 。 尽 管 如 此 ， 在 这 里 我 们 还 是 试图 给 出 这 些 特 性 的 一 些 
思想 岂 及 它们 的 重要 意义 。 这 使 读者 在 以 后 学 习 细节 内 容 时 有 一 个 全 局 的 观念 。 

和 下面， 我 们 按 顺 序 对 每 个 主题 给 出 简短 的 说 明 。 读 者 会 发 现 那些 为 个 人 电脑 设计 的 廉价 
的 小 型 数据 库 管 理 系 统 并 不 具备 所 有 的 特性 。 例 如 ，PC 数 据 库 系 统 因为 只 有 一 个 用 户 访问 ， 
所 以 通常 不 是 多 用 户 系 统 。 

1. 第 2 章 : 关系 模型 

第 2 章 一 开始 ， 介 绍 多 年 来 支配 数据 表达 方式 的 关系 模型 的 概念 和 规则 。 一 份 更 详细 的 定 
义 有 助 于 用 户 弄 清楚 哪些 特性 是 用 户 所 潜 望 的 ， 舍 么 时 蛋 一 个 商业 产品 提供 的 特性 不 属于 标 
淮 模 型 。 我 们 已 经 说 这， 有 一 条 规 旭 规定 表 中 的 值 未 能 是 名 值 的 。 这 样 ，students 表 的 
hobby 列 在 同一 行 中 不 允许 有 儿 个 值 (如 chess、hiking ，skeet shooting }。 这 样 的 多 值 列 在 芋 
期 的 数据 模型 中 是 允许 的 ， 称 做 “重复 字段 " ， 但 在 关系 模型 中 是 禁止 的 。 我 们 已 经 知道 这 样 
的 多 值 列 在 对 象 - 关 系 模型 中 又 变 得 合法 了 ， 这 看 来 是 下 一 步 的 发 展 方向 。 美 系 规则 的 一 个 重 
要 作用 是 为 量 期 关系 模型 的 不 同 产品 提 供 了 统一 的 标准 ， 这 使 所 有 的 数据 库 设 计 变 得 一 致 。 
即使 如 此 ， 在 没有 重 太 损害 的 情况 下 ， 有 些 规则 经 常 被 打破 (不 过 在 对 象 - 关 系 模型 之 前 ， 第 
一 范式 规则 从 没有 馈 打 和 破 过 )。 

接 下 来 ， 我 们 从 关系 代数 固有 的 查询 能 力 方面 介绍 关系 模型 的 特性 ,关系 代数 包含 一 个 
基于 表 的 操作 集 人 台 ,， 用 这 些 操 作 可 以 产生 新 的 表 ( 就 像 实 数 的 乘 和 加 运算 产生 新 的 实数 -~ 样 )。 
关系 代数 的 概念 在 后 面 儿 章 中 有 重要 的 价值 ， 因 为 许多 数据 库 的 查询 可 求 可 以 表示 为 关系 代 
数 表 达 式 一 一 但 在 关系 模型 中 ， 查 询 总 以 表 的 形式 出 现 。 商 业 DBMS 产 品 用 SQL 语言 面 不 是 关 
系 代 数 产 生 讶 算 机 化 的 查询 。 但 是 与 SQL 相 比 关系 代 数 有 一 个 好 处 : 它 的 运算 少 ， 而 且 这 
些 运 算 描 述 简单 透彻 。 任 何 可 用 的 查询 语言 ， 例 如 SQL， 都 必须 包含 所 有 的 关系 代数 的 运算 。 
学 习 关 系 代 数 的 运算 是 很 有 意义 的 ， 因 为 你 可 以 遂 过 它 理解 查询 操作 ， 而 且 它 的 形式 比 SQL 
简单 。 瀑 憾 的 是 ， 至 今 还 没有 类 似 的 对 象 - 关 系 代 数 。 . 

2. 第 3 章 : 基本 SQL 查询 语言 

第 3 章 深 入 介绍 了 工业 标准 关系 查询 语言 SQL。 因 为 工业 标准 SQL，Core SQL-99， 还 设 
有 被 所 有 的 数据 库 产品 采用 。 我 们 用 “基本 SQL” 谐 法 介绍 被 所 有 主要 关系 数据 库 产 品 普 各 
采用 的 特性 ， 用 “高 级 SQL” 介 绍 还 未 普遍 采用 的 竺 性。 我们 推迟 到 第 4 章 介绍 对 象 -关系 模 
型 。 第 3 音 中 的 所 有 语法 只 跟 关 系 模型 有 关 。 图 1-2 是 对 图 1-1a 学 生 记录 数据 库 进 行 关系 SQL 查 
询 的 例子 ， 同 时 还 以 表 的 形式 给 出 了 查询 结 米 。 

通过 察看 网 1-1a 的 stuaents 表 中 cl1ass 列 值 等 于 2 的 学 生 姓 名 和 学 所 可 以 验证 图 1-2 中 
的 结 玉 。 

图 1-3 展 示 了 一 个 更 复杂 的 查询 。 看 图 1-1a， 为 了 得 到 查询 结果 ,我 们 同时 需要 来 家 
students 和 和 enrollment 表 的 信息 。 如 果 单 看 students 表 ， 我 们 不 知道 学 生 上 什么 课 ; 如 果 
单 看 enrollment 表 ， 就 不 知道 学 生 姓 各。 我 们 先 从 enrollment 表 中 查 出 cno 等 于 101 的 sia， 
然后 依据 这 个 sia 值 在 students 表 中 查 出 学 生 姓 名 。 图 1-3 中 的 SQL 语 名 表示 了 这 种 查询 方法 。 

图 1-2 和 图 1-3 的 结果 一 样 并 不 能 说 明 这 两 个 查询 的 含义 相同 。 没 有 理由 相信 上 Frenchl( 琴 
程 号 汐 101) 的 所 有 学 生 愉 好 等 于 学校 里 所 有 大 二 (cl1ass=2) 的 学 生 ， 这 私 私 是 个 巧合 ， 只 说 
明 对 这 个 例子 来 说 ， 现 个 查询 的 结果 恰好 四 等。 对 于 另 一 个 enrollment 表 ， 这 两 个 查询 很 
可 能 产生 不 同 的 结果 。 这 说 明了 一 个 重要 的 概念 : 列 由 创建 数据 库 的 人 设计 ， 以 后 不 再 更 改 ;而 
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对 应 于 表 中 的 数据 记录 的 行 希 望 经 常 更 改 而 不 产生 警告 。 两 全 查询 语义 相同 当 且 仅 当 对 于 表 
中 所 有 可 能 的 相关 行 值 ， 查 诲 结果 都 相同 。 


检索 所 有 太 二 学 后 的 sid 和 和 iname. 


SOL: select sid,. Tname from students 
where class = 全; 


站 六 二 本 全 三 





1-2 学 生 记录 数据 库 中 的 一 个 SQL 查询 
捡 索 上 401 与 课 的 学 生 的 sit 和 lname。 


SOL; select students.sid, Tname from students, enrolliment 
where students.sid = enTOl liment .ssid 
and enroliment,.cno = 101: 


ANSWer 





图 1-3 学 生 记 菏 数 据 库 中 的 另 一 个 SQL 查 询 


SQL 语 言 还 包括 向 表 中 插 人 新 行 的 语句 、 删 除 现存 行 的 语句 、 更 新 现存 行 的 某 些 列 值 的 语句 。 
{ 和 参见 图 1-4)。 把 SQL 语音 简单 地 称 为 查询 语言 以 及 在 SQL 语句 是 实际 的 Update、lnsert、DPelete 语 名 时 
将 SQL 语句 统称 为 查询 可 能 不 和 准确， 但 术语 “查询 ”的 这 种 广义 用 法 已 经 约定 俗 成 。( 有 些 作 者 把 
SQL 更 确切 地 称 为 数据 操作 语言 或 数据 库 语 言 。) 为 了 方便 起 见 ， 在 不 影响 理解 的 依 况 下 ， 本 书 把 
SQL Update 、Insert、 和 Deletei 语 句 合 称 为 于 新 语句 ， 只 有 它们 之 闻 的 区 别 特别 重 要 时 才 单 独 指出 。 


在 etudencs 表 中 揪 人 一行 f6, Green, Jobn, 1.555-11331。 

tL: insert into students vatues (6, Green，Jonn，1 SS-1133): 
在 students 表 中 删除 太 三 学 生 的 记录 。 

SOL: daelete from students where class = Jd: 


把 courses 表 中 房间 号 2-113 收 为 2-121。 





SOL: update courses set Croom = ‘2-12]" where croom = 2-113".; 


疼 14 SQL 中 删除 、 播 信和 更 新 操作 


3. 第 4 章 ; 对象 一 关系 模型 

第 4 章 中 ， 我 们 详细 介绍 了 对 象 - 关 系 模型 的 特性 。 首 先 介 绍 用 户 自 定 光 类型， 这 使 用 户 可 
以 创建 如 图 !-lb 中 含有 结构 化 和 汇集 值 的 表 。 如 果 用 第 3 章 介 绍 的 SQL 语言 从 这 样 的 表 中 检索 数 
据 ， 要 做 若干 语法 扩充 ,我们 在 这 里 要 介绍 扩展 的 对 象 -关系 SQL ( ORSQL )。 不 幸 的 是 ， 我 们 
所 学 习 的 数据 库 产品 ORACLE、INFOMIX 和 DB2 UDB 中 ， 扩 展 SQL 的 语法 不 一 样 。 所 以 我 们 不 
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得 不 把 教材 分 成 两 个 部 分 ， 分 别 介绍 前 两 个 产品 。 经 过 几 年 的 修改 ， 于 1999 年 发 布 的 产业 SQL 标 
准 一 一 SQL-99 人 在 语法 特性 上 确立 了 规范 ， 我 们 和 希望 不 同 产品 的 各 种 DRSQL 最 终 会 统一 到 这 个 标 
准 上 来 。 得 对 十 我 们 这 样 的 教材 来 说 ， 事 情 发 展 得 太 快 了。 我 们 只 能 努力 介绍 有 实用 价值 的 语 
法 。 读 者 可 以 访问 本 教材 的 主页 htp:Awwwcs-umb.edur~poneiydbppp.html 来 获取 最 新 的 发 展 情 况 。 

如 果 图 1-1b6 中 对 和 象 - 关 系 表 包 会 的 列 与 关系 表 中 的 列 相 同 ， 那么 不 用 奇怪 ,对 该 表 的 查 涧 
与 第 3 章 中 的 SQL 查询 一 样 。 例 如， 图 1-2 中 的 关系 SQL 查询 语句 ， 由 于 姓 现 在 是 name 列 的 一 
部 分 而 不 是 单独 的 一 列 ， 所 以 只 需 把 1name 改 为 name . Iname 就 变 成 DRSQL 语 名 了 -。 但 是 图 
1-3 中 的 查询 ， 用 到 了 关系 SQL 中 的 连接 ( 与 snrol1lment 表 儿 而 enrol2ment 表 在 对 象 -天 
系数 据 库 中 变 成 students 表 的 一 个 列 ， 这 时 变化 就 很 大 了 (参见 网 1-5 )。 


检索 上 101 号 课 的 学 本 的 sid 和 和 ]nare。 


SOL: select sid, name. name from students 
where 101 in 
{select cno from tabletstudents.enrol Iment})}.: 


aNnsSwer 


| 


图 1-5 学 生 忆 录 数 据 库 中 的 一 个 ORSQL 查 询 


在 图 1-5 中 ， 括 号 中 的 Select 于 名 利用 enrollment 汇 集 ， 把 每 个 学 生 所 上 的 所 有 课程 的 
cno 收 集 到 一 个 行 集合 中 ， 然 后 where 101 in 语句 检查 101 是 否 在 某 个 学 生 的 cne 集 人 台中， 
如 果 在 此 集合 中 ， 则 返回 TRUE 给 顶层 Select 语 句 ， 打 印 这 个 学 生 的 sid 和 name. lname。 

ORSQL 同 样 产生 捅 人 人、 删除 和 更 新 操作 .。 看 图 1-6 的 例子 ,这 个 简单 的 例子 把 汇集 类 型 的 
数据 当 作 一 个 整体 处 理 ， 我 们 也 可 以 裔 历 社 集 ， 对 其 中 每 一 行进 行 操作 。 





在 students 表 中 插入 学 生 John Green 的 i 记 末 ， 


“OL: insert into students values 
{6, Green, John, 1, 555-1133, Settrow(t lOl, No ,rowt 108,"Yes"})); 


期 队 所 有 只 上 101 号 课 , 旦 101 叶 齐全 是 主 齐 的 学 生 记 录 。 


5 和 上 L: delete from students where students.enrollment = set(trowt 10l1, No")): 


巾 改 1 号 车 牛 的 enrollnmetn: 属性 ， 梧 他 上 105 号 非 主 覆 课 和 107 号 二 能 课 


SOL: update students set enroliment = settrow( i085, No ?rowt O07, Yes" }) 
where sid = 1; 





疼 1-6 删除 、 搬 入 和 更 新 的 ORSQL 语 条 


在 第 4 章 的 最 后 几 节 中 ， 我 们 党 当 怎 样 通 过 书写 任意 复杂 的 用 户 自 定义 函数 (UDPF ) 来 增 
强 对 象 - 关 系 SQL 的 能 力 ，UDF 可 以 用 到 非 过 程 SQL 语 名 中 实现 任何 程序 化 的 操作 。 

4. 第 3$ 章 : 访问 教 据 产 的 程序 

在 第 4 章 的 例子 中 (最 后 一 节 除 外 )， 我 们 集中 介绍 了 这 样 一 个 环境 : 用 户 交 互 地 把 SQL 查 
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询 语 名 输入 数据 库 系统 (一 个 查询 接口 )， 然后 系统 把 结果 以 表 的 形式 输出 到 用 户 显示 屏 上 。 
这 的 祖 是 获得 溃 词 结果 的 一 种 方法 ， 但 不 是 唯一 的 一 种 。 我 们 在 第 5 但 中 将 讨论 ， 实 际 上 太志 
数 的 查询 都 是 通 这 一 个 应 用 程序 界面 提交 的 。 这 里 ， 应 用 程序 员 用 诸如 CC、Javya 等 高 级 语言 或 
DBMS 提 供 的 特殊 的 过 程 性 SQL 语言 编写 程序 。 程 序 执行 时 ， 一 般 以 菜单 的 形式 与 监视 器 用 户 
交 王 【可 能 有 多 个 用 户 同时 执行 该 程序 ) 用 户 选 
择 菜 单 选项 ， 然 后 程序 可 以 通过 完成 一 个 或 儿 个 . 
SQL 查 询 来 执行 由 用 户 的 菜单 选择 提交 的 任务 。 所 es 
有 的 行为 都 出 监 视 器 用 户 操纵 相关 某 单 的 选项 控制 Title: 
一 一 实际 上 任何 时 候 ， 监 祝融 用 户 都 不 直接 创建 Subject: robotics 
SQL 查 询 。 和 在 图 1-7 中 ， 我 们 给 出 菜单 交互 的 合子。 、 
在 图 1-7 中 ,用 户 想 查询 Isaac Asimov 写 的 所 有 的 人 了 
关于 “机 器 人 学 ”(robetics) 的 书 。 为 了 使 用 方便 ， 可 以 使 用 SQL 语言 提供 的 各 种 通配符 。 侈 
如 ， 在 用 户 不 清楚 祷 写 的 时 候 ， 可 以 用 “Asim 多 ”代替 “Asimov” 或 “Asimoff"。 在 Subject 
栏 的 关键 宁 的 选择 可 能 以 字母 表 的 次 序列 出 。 这 对 于 程序 来 说 是 额外 的 工作 ， 但 不 这 样 用 户 
就 不 清楚 是 使 用 “robotic” 还 是 “robot”， 亦 或 “robots”。 
在 这 里 要 注意 : 虽然 SQL 查询 【或 其 他 的 SQL 语句 ) 可 以 在 程序 内 部 执行 ,但 C、Java 等 
大 多 数 高 级 语言 布 支持 SQL 查询 ， 所 以 要 用 一 种 特殊 的 标记 【 如 图 1-8 的 C 程 序 代码 中 开头 的 
exec sdl ) 指出 SQL 语句 。 程 序 通过 预 处 理 髓 运行， 这些 特殊 的 格式 被 转化 为 对 数据 库 果 
数 库 中 心 国 数 的 合法 调用 ， 然 后 由 编译 程序 产后 一 个 可 执行 程序 。 


Library Database Selector Menu 





exec sgl beygin declare sectfions,; fC variables known to SQL 
char liname[18]; iw author 1ast name variable 
char fname[ld]: i* author first name variable 
char titlel 0]: A:* book title variable 
char subject[2d4]: i book subject vartable 


exEc Sql] end declare section; 


EXEC 5s91 declare Cl cursor for 1:* define cursor for query 
sglect alname, afname, title, subject from library 
where alname = :1namev and afname = :fnamev 
and title = :title and subject = :subject: 


menutliname, fname .title, subject); i* function to display menu 
i* begin guery, start cursor 


-XEt S91 Open cl 
exec sgl whenever not found goto alldone; i* set up for loo0p termination 
while {TRUEY [ i* row by row printout 
exec sq]l fetch el into :Tname,:fname, :titie,:subject: /* get row values 
displayrowt liname, fname,title, subject}: J/* print them out 
} 


alldone: ji* reached When loop is done 





图 1-8 一 段 (简化 的 ) 用 于 数据 库 访问 的 程序 


把 SQL 语 句 放 到 高 级 语言 程序 中 的 做 法 称 为 嵌入 式 SQL 编 程 。 如 果 你 有 过 这 样 的 编程 经 
历 : 把 C 结 构 写 人 磁盘 文件 ， 然 后 再 读 出 ; 那么 你 会 发 现 用 SQL 做 这 些 事 是 多 么 的 简单 。 特 别 
是 ， 拒 人 式 SQL 使 得 程序 员 遇 到 的 最 困难 的 任务 之 一 完成 起 来 比较 容易 。 我 们 会 看 到 ， 
DBMS 利 用 很 多 基于 磁盘 的 数据 结构 来 有 效 地 访问 数据 ， 但 程序 塑 辑 中 不 必 知 道 这 些 结构 ， 
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其 中 仅 引 用 表 的 结构 和 表 中 包 合 的 列 值 。 程 序 逻 辑 中 也 不 必 了 解 访问 模式 、 文 件 中 的 位 置 、 
记录 结构 等 ， 所 有 这 些 细节 都 由 DBMS 处 理 ， 这 种 特性 称 为 程序 -数据 独立 性 。 表 的 结构 随 着 
时 间 的 流逝 市 发 生变 化 时 ， 程 序 - 数 据 独 江 性 的 重要 性 就 日 益 明 显 。 表 中 可 能 会 增加 一 些 列 ， 
而 行 数 的 增加 可 能 使 原 有 的 单个 磁盘 不 能 容纳 整个 表 ， 从 而 分 割 存 情 到 儿 个 磁 失 中 ， 这 些 变 
化 引起 对 新 的 数据 结构 的 需求 ， 以 吉 快 根据 列 值 访问 行 ( 类似 通 过 卡片 目录 查找 图 书馆 中 的 
书 ) 的 速度 。 在 一 个 设计 合理 的 数据 库 里 ， 所 有 这 些 需 求 都 不 会 影 啊 应 用 程序 的 侯 辑 结构 。 
程序 -数据 独立 性 非常 重要 ， 我 们 为 它 给 出 本 节 崔 一 一 个 正式 定义 ; 

定义 1.3.1 程序 -数据 独立 性 是 具有 良好 构造 的 数据 库 的 一 种 特性 ， 它 使 应 用 程序 逻辑 的 
存储 结构 和 存 取 方 法 免 于 修改 。 

S, 第 6 章 : 数据 库 设 计 

数据 库 管理 员 (DBA ) 要 处 理 数 据 库 从 创建 开始 的 整个 生存 周期 里 各 个 方面 的 工作 。 一 
开始 ，DBA 深 入 研究 要 用 关系 数据 库 来 表示 的 企业 。DBA 研 究 现实 世界 中 组 成 企业 的 数据 对 
象 的 基本 属性 和 相互 关系 ， 并 为 之 建 模 。 这 样 做 的 目的 是 为 了 提供 一 种 把 这 样 的 对 象 表示 戌 
关系 表 中 列 的 准确 方法 。 作 为 这 种 表示 法 的 一 部 分 ，DBA 还 制定 规则 ， 即 完整 性 约束 ， 来 限 
制 对 数据 可能 的 更 新 。DBA 工 作 的 前 期 阶段 称 为 数据 库 膛 辑 设 计 ， 简 称 为 数据 库 设 计 。 数 据 
库 设 计 是 一 个 极其 复杂 的 研究 领域 ， 在 这 个 领域 中 要 求 DBA 识 别 各 种 反映 现实 世界 的 数据 天 
系 ， 是 一 种 以 实用 为 上 月 的 ， 但 又 类 似 抽 象 的 暂 学 方法 的 数据 分 类 学 。 在 本 书 中 ， 我 们 要 学 习 
两 种 基本 的 数据 库 设 计 方 法 。 一 种 方法 是 赁 直觉 识别 现实 世界 中 的 数据 分 类 ， 称 为 实体 -关系 
模型 【E-R 横 型 ) ; 另 一 种 方法 ， 作 为 前 一 种 的 补充 ， 称 为 数据 库 规 范 化 (database 
normalization)。 这 些 方 法 将 在 第 6 章 中 具体 介绍 。 

分 析 一 个 诸如 一 所 大 学 这 种 大 型 的 对 象 时 ， 我 们 要 识别 将 在 关系 表 中 表示 为 列 名 的 为 数 
众多 的 各 部 分 数据 。 很 明显 ， 我 们 需要 一 些 指导 规则 决定 如 何 把 这 些 列 名 联系 起 来 ， 哪 些 应 
放 在 同一 个 表 中 ， 哪 些 应 放 在 不 同 的 表 中 。 这 是 逻辑 设计 的 基本 问题 。 首 先 ， 我 们 把 对 象 区 
分 为 实体 ， 有 时 称 为 实体 集 或 实体 类 型 是 一 类 真实 存在 、 彼 此 之 间 可 区 分 的 对 象 。 作 为 一 
个 例子 ,我 们 考虑 某所 大 学 的 全 体 学生 组 成 的 集合 ， 并 将 其 命名 为 实体 Students。 与 每 个 
实体 相连 的 是 描述 和 区 别 这 些 对 象 的 属性 集合 。 在 图 1-1a 中 ， 我 们 把 students 实 栖 具 体 化 
为 一 个 关系 表 (命名 为 students 让 它 包 含 一 组 描述 学 生 的 列 名 (属性 ): sid，lname， 
fname，class 和 kelephone。 在 大 学 里 必须 保存 的 另 一 类 对 象 是 Courses 实 体 。 在 图 
1-1a 中 有 一 个 courses 表 ， 包 含 描述 不 同 课程 的 属性 : cno, cname，croom 和 time。 

图 1-1a 中 的 第 三 个 表 enrol lment 表 示 的 并 不 是 一 个 实体 ， 而 是 实体 间 的 联系 ， 在 图 1-9 
的 实体 -联系 图 中 ， 以 动词 形式 命名 为 enrolls_in。 每 个 学 生 要 下 多 门 课 ， 每 门 课 有 多 个 学 
生 上 。 在 图 1-9 的 E-R 图 中 ， 窜 形 表 示 和 实体， 椭圆 表 示 属 性 ， 萎 形 表 示 实 体 间 的 联系 ， 实 体 与 
相关 属性 以 及 实体 与 联系 之 间 用 线段 连结 。 

在 为 一 个 大 企业 设计 新 的 数据 库 时 ， 实 体 -关系 观点 使 数据 库 设 计 者 对 在 设计 过 程 中 要 过 到 
的 数据 项 汇集 产生 一 个 大 致 的 印象 。 当 每 个 实体 都 被 识别 出 来 后 ， 就 能 清楚 地 看 到 很 多 数据 项 仅 
能 作为 描述 某 个 实体 的 属性 ， 这 样 一 个 关系 表 和 很 多 列 就 被 识别 出 来 。 随 着 DBA 深 和 人 研究 这 个 实 
体 ， 很 多 原本 不 清楚 的 属性 也 被 识别 出 来 。 因 为 我 们 还 没有 介绍 联系 的 很 多 重要 属性 ， 设 计 表 示 
联系 的 关系 表 会 更 复杂 一 些 。 其 实 ， 有 些 联 系 并 不 转化 为 一 个 单独 的 表 ， 而 是 表示 为 实体 表 的 一 
个 列 ， 称 为 “外 键 ”(foreign key)。 在 第 6 章 中 ， 我 们 再 详细 介绍 利用 E-R 图 设计 数据 库 。 
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1-9 学 生 记 了 录 数 据 库 的 E-R 表 


6. 第 7 章 : 完整 性 、 视 图 、 安 全 和 目录 

DBA 完 成 数据 库 的 退 辑 设 计 以 后 ， 还 有 很 多 物理 层面 的 工作 要 做 ; 把 逻辑 设计 转换 成 用 
户 可 以 访问 的 计算 机 化 的 表示 法 。 我 们 首先 说 明 许 多 DBA 用 来 创建 数据 库 表 的 SQL 命令 和 其 
他 的 数据 库 实 用 程序 ， 再 把 数据 从 操作 系统 输 人 文件 中 载 人 表 ， 最 后 在 不 断 变化 的 环境 下 维 
护 数 据 库 。 大 部 分 的 命令 都 是 很 直观 的 。 你 可 能 希望 一 开始 就 能 掌握 一 些 简 单 的 创建 表 的 命 
令 ， 以 便 练 习 SQL 查 询 ; 然而 ， 一 开始 创建 的 表 都 是 简单 的 缺 省 模式 ， 缺 少 后 面 几 章 介 绍 的 
诸如 完整 性 约束 、 数 据 视 图 、 安 全 性 约束 等 性 质 ， 也 没有 文 持 商 性 能 访问 的 索引 结构 。 在 下 
面 的 几 节 中 ， 我 们 简单 介绍 某 些 性 质 的 价值 ， 基 体内 容 在 第 7 章 中 展开 。 

(1) 完整 性 约束 

在 逻辑 设计 过 程 中 ，DBA 已 经 确定 了 很 多 数据 完整 性 约束 ， 这 些 都 是 数据 库 在 任何 时 候 
都 必须 遵守 的 重要 规则 。 例 如 ， 布 规则 规定 : ceurses 表 的 每 一 行 都 有 唯一 的 cen 人 情 【〈 一 个 
课程 号 不 能 被 两 门 不 同 的 课程 共用 )。 另 一 个 例子 是 enrollment 表 中 sigd 列 的 每 一 个 值 在 
students 表 中 都 有 对 应 的 行 ( 引用 完整 性 约束 ), 或 savings_accounts 表 中 balance 列 
的 值 不 能 少 于 $25.00( 最 少 结余 )。 很 明显 ， 如 果 一 个 表 最 初 遵守 完整 性 约束 ， 后 来 却 出 错 ， 
那么 ， 这 只 可 能 是 由 某 个 SQL 更 新 操作 造成 的 一 一 例如 ， 某 个 SQL 操作 把 一 行 捅 人 到 
cour ses 表 中 ， 新 插 人 的 行 与 康 表 中 的 某 一 行 有 相同 的 cno 值 。 

如 果 我 们 不 允许 即席 的 SQL 更 新 ， 却 么 ， 通 过 在 应 用 程序 钠 辑 中 添加 周全 的 强制 性 检查 
规则 ， 就 可 以 保证 所 有 这 些 完整 性 规则 (*……… 在 插 人 新 的 ceurses 行 时 ， 程 序 员 总 得 检查 
cno 是 否 重 复 ……… " )。 然 而 ， 把 强制 检查 的 工作 留 给 应 用 程序 员 的 司法 并 不 是 关系 数据 库 管 
理 系统 采用 的 方式 。 相 反 ，DBA 创 建 完 整 性 约束 就 像 创建 不 同 的 实体 ， 这 种 约束 由 DBMS 目 
动 执行 ， 所 以 对 于 任何 约束 都 不 可 能 出 现 无 意 间 被 打破 的 情况 。 采 用 这 种 方式 的 好 处 是 ， 即 
使 是 即席 更 新 或 由 无 经 验 的 程序 员 编 写 的 拙 儿 的 应 用 程序 逻辑 也 不 会 损害 数据 的 合法 性 。 攻 
1-10 显 示 了 ORACLE 数据 库 中 的 一 个 例子 : 用 SQL 语 言 创建 完整 性 约束 的 语法 。 





为 staadenkca 表 增 加 完整 性 鬼 束 ， 确 保 c=;ass 列 的 值 只 能 在 1 和 4 之 间 。 注 意 这 是 
CRACLE 数据 库 中 合法 的 SQL 语 人 多 。 


sOL: alter table students modify 
tclass smallint checkiclass >= 1 and class 《一 十) 





图 !-10 在 ORACLE 中 创建 新 的 完整 性 约束 的 命令 


(2) 数据 和 数据 库 安 全 的 集中 控制 
注意 把 信息 放 在 两 个 不 同 的 数据 库 中 会 产生 严重 的 后 果 : 一 个 查询 不 能 同时 从 两 个 数据 
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库 中 取出 数据 。 合 如， 前 面 所 到 的 学 生 记 录 数 据 库 和 大 学 图 书馆 数据 库 。 如 果 一 个 掌 生 所 人 异 
的 书 超期 ， 对 于 图 书馆 而 言 打印 催 书 信和 邮寄 标签 的 程序 就 不 能 使 用 学 生 记 录 数 据 库 中 的 学 
牛 件 引 。 这 意 睦 着 大 学 图 书馆 数据 库 必须 保皇 一 份 学 生 住 址 的 自己 的 备份 。 这 被 称 为 数据 完 
余 (data redundancy)( 数据 重复 一 一 可 能 是 不 必要 的 )。 这 不 是 一 个 很 好 的 选择 ， 因 为 当 学生 
记录 数据 库 里 登记 的 学 生地 韦 被 更 改 时 ， 会 造成 图 书馆 数据 库 里 的 学 生地 址 过 期 。 可 以 采用 
另 一 种 方法 来 获得 最 新 的 地 址 : 频繁 地 给 邮局 写 信 询问 地 址 的 变化 情况 ， 然 后 由 职员 根据 新 
的 地 址 更 新 数据 库 中 的 记录 这 样 做 的 结果 是 大 大 增加 了 注册 办 会 室 的 费用 、 而 这 都 是 由 于 
在 一 个 分 离 的 数据 库 中 构建 表 造 成 的 。 

这 种 讨论 指出 这 样 一 个 优势 : DBA 可 以 利用 相关 信息 把 数据 库 结 合 起 来 ， 集 中 控制 数据 以 减 
少数 据 宛 余 。 数 据 的 集中 控制 是 著名 的 数据 库 原 理 ， 但 是 ， 集 中 也 有 它 的 缺点 . 例如， 我 们 也 许 不 
希望 学 生 图 书 管理 员 能 够 更 新 (其 至 是 察看 ) 学 生 记 录 中 有 关 评 分 、 学 费 和 病史 等 内 容 。DBA 可 以 利 
用 一 套 安 全 性 命令 实现 这 些 约束 ， 并 在 创建 视图 时 使 用 安全 性 约束 。 安 全 性 命令 的 执行 方式 类 似 完 
整 性 约 东 ， 由 DBMS 在 底层 自动 执行 ， 这 使 用 户 不 能 利用 SQL 语句 访问 或 更 新 革 些 表 或 表 中 的 其 些 
字段 ,除非 用 户 明确 地 著 得 DBA 的 授权 。 安 全 性 在 SQL 中 统 -- 用 Grant 霄 杀 声 明 ， 几 乎 所 有 的 关系 
数据 库 产 品 都 提供 这 个 巧 能 。Grant 香 名 有 完备 和 灵活 的 特性 。 人 举例 来 说 ， 可 能 允许 一 组 用 户 对 一 
个 表 司 读 访问 ,得 不 允许 更 新 。 图 1-11 显 示 了 一 个 用 标准 的 SQL 语 法 设置 完整 性 约束 的 例子 。 


授权 允许 ponel 用户 在 studsnce 表 中 执行 sciect、update 和 1inscrL 把 
作 ， 蕊 不 人 允许 执行 aelete 操作 。 


SOL: grant seTect, update, insert on students to poneil:; 





图 1-11 标准 SQL Grant 语 人 苛 


(3) 数据 库 视 图 

集中 控制 存在 一 个 隐 舍 问题 是 连接 带 有 相关 信息 的 数据 库 时 的 逻辑 复杂 性 。 例 如 ， 一 个 
简单 地 验 让 大 学生 保险 金 的 应 用 程序 可 能 要 外 理 几 十 个 表 来 获取 需要 的 列 信 息 ， 而 其 中 很 多 
表 的 名 字 和 用 途 可 能 完全 与 健康 保险 无 关 。 这 使 得 培训 程序 员 的 工作 变 得 很 困难 。 而 且 ， 在 
一 个 大 的 机 构 里 ， -开始 就 把 所 有 相关 的 数据 库 结 合 起 来 也 是 不 可 能 的 一 一 我 们 应 该 允许 数 
据 库 的 分 阶段 实施 。 在 这 个 过 程 中 ， 集 中 控制 的 好 外 是 在 将 新 数据 库 结合 起 来 的 过 程 中 逐步 
增长 的 。 为 了 消除 宛 余 ， 当 加 人 新 表 时 ， 我 们 不 得 不 重 写 应 用 程序 ， 用 对 新 列 的 访问 代替 对 
旧 列 的 访问 。 我 们 希望 有 一 种 方法 能 够 确保 表 的 数目 的 增 可 不 会 导致 境 训 程序 员 的 问题 ， 并 
且 能 够 保证 在 为 消除 数据 元 余 而 重新 安排 旧 表 时 不 必 重 写 原 来 的 应 用 程序 。 

使 人 惊奇 的 是 ， 这 些 问 题 都 可 以 通过 称 为 数据 库 视图 的 DBMS 特 征 来 解决 。 视 轿 命 令 允 
许 我 们 创建 一 个 假想 的 或 虚拟 的 视图 表 ， 视 图 表 中 的 行 是 利用 SQL 中 的 Select 语 齐 作 用 于 其 化 
表 来 定义 的 。 产 生 视 图 的 表 中 地 可 以 是 视图 表 ， 但 视图 表 中 的 行 最 终 都 基于 以 文件 形式 存储 
在 磁盘 上 的 基本 表 。 在 图 1-12 中 ， 我 们 提供 了 一 个 用 标准 SQL 语法 创建 视图 表 的 鲍 子 . 

视图 的 巨大 功用 (在 理论 上 ) 源 于 这 样 一 个 事实 : SQL 中 的 Select 语 句 可 以 访问 -个 视图 
表 ， 就 像 访问 一 个 真正 的 表 。 这 样 ，DBA 就 可 以 把 几 个 【新 ) 表 中 的 相关 字段 组 成 一 个 【5 旧 ) 
表 的 虚拟 拷贝 ， 供 原 有 的 应 用 程序 频繁 访问 。 在 数据 库 中 ，DBA 通 过 创建 仅 与 特定 应 用 有 关 
的 视图 ， 可 以 简化 培训 程序 员 的 数据 库 环 境 。 视 图 还 提供 了 天衣无缝 的 安全 性 措施 ， 使 得 未 
被 授权 访问 的 字段 和 表 的 用 户 不 能 访问 。 很 上 明显， 视图 扩充 了 程序 - 数据 独立 的 概念 : 应 用 
程序 逻辑 不 仅 不 受 物理 硝 储 结构 的 变化 的 影响 ， 也 不 受 基 本 表 结 构 的 带 辑 变化 的 影响 。 
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创建 一 个 名 为 studentecoureea 的 视图 表 ， 列 出 学 生 名 学 和 学 号 1sjg) 以 及 这 
个 学 生 所 上 课程 的 课程 名 和 课 各 呈 1coo} ， 


SOL: ereate view studentecourses Ciname, sig, chname, cno) 


85 8381lect 5s.1name, Ss.3id,. cc.cname, CC.cno 
From students $s, COUrses ££, enrollmernt e 
Where e.cno 一 -Cno and e.sid = 5.51d: 





图 1-12 创建 视图 表 的 标准 SQL 合 令 


不 地 的 是 ， 实 际 十 按 商 业 SQL 标 准 实现 的 视图 在 某 些 方面 与 理论 还 有 差 中 。 虽然 基于 多 
个 基本 表 可 以 创建 一 个 相对 概 插 的 视图 表 ， 但 对 于 访问 这 个 视图 表 的 SQL 语 句 却 有 很 多 限制 。 
具体 来 说 ， 蘑 些 select 语 句 和 纵 太 多 数 的 更 新 操作 都 有 是 不 允许 的 ， 虽然 它 们 很 有 用 。 把 用 户 对 
视图 的 更 新 转化 为 对 基本 表 的 更 新 是 困难 的 ， 这 表明 视图 上 的 某 些 更 新 语句 在 理论 上 还 有 -- 
些 局 配件 (包括 Update，Insert 和 Delete 语 苛 )]。 当 然 我 们 可 以 不 便 用 这 些 操作 ， 但 在 商业 标准 中 
为 了 方便 系统 实现 ， 又 省 弃 了 其 他 很 多 有 用 的 器 新 操作 。 将 来 我 们 期 待 能 看 到 更 少 局 腿 性 的 
视图 ， 但 现在 却 不 得 不 面 对 大 量 的 人 为 限制 。 

7. 第 8 章 : 索引 

在 安装 数据 库 的 时 候 ，DBA 的 一 个 主要 职责 是 决定 如 何在 磁盘 上 安排 基本 表 ， 以 及 创建 
什么 样 的 索引 来 优化 应 用 程序 和 交互 操作 所 请 求 数据 的 访问 ， 这 就 是 所 谓 的 数据 库 的 物理 设 
计 。 第 8 章 结合 实际 数据 库 系 统 研究 如 个 选择 设计 方案 ， 讨 论 数 据 存储 与 索引 的 种 种 方式 。 

索引 和 表 的 设计 

我 们 从 一 个 主要 的 RDBMS 产 品 ORACLE、DB2 UDB 和 INFORMIX 提 供 的 有 关 功 能 着 于 
研究 数据 库 的 物理 设计， 而 有 我 们 把 注意 力 集中 在 索引 上 ， 当 索引 被 设置 成 表 的 某 一 列 的 值 
时 (例如 图 1- 1 a 中 students 表 的 Lname 列 )， 索引 类 似 十 图 书馆 里 查 书 用 的 目录 卡片 例 
如 ， 系 统 可 以 通过 lname 索 引 执 行 查 启 合 句 。 

select sid, class from students Where Tname = smith’; 

lname 的 值 “Smith” 在 索引 中 被 迅速 找到 ， 然 后 索引 项 给 出 lname 值 等 于 “Smith” 的 
行 ( 可 能 不 J 上 一 行 ) 的 位 置 。 当 然 ， 对 图 1-1a 中 内 有 少数 儿 行 的 students 表 来 说 ， 这 样 的 索 
引 并 没有 什么 用 处 。 但 在 实际 应 用 中 ， 一 个 表 往 往 包含 几 十 行 ， 在 这 样 的 表 中 查询 某 些 行 的 
时 间 主 要 花 在 检查 每 一 行 是 否 符 合 查 询 条 件 上 。 这 时 ， 利 用 索引 可 以 大 大 提高 浊 询 的 效率 ， 
男 一 种 方式 是 直接 把 行 按 菜 种 索引 的 次 序 排列 ， 称 为 到 灸 (clustering)， 这 类 似 于 在 图 书馆 书 
架 上 按 作 者 次 序 排列 韦 。 育 簇 只 能 是 单 索 引 ， 不 过 这 种 附加 的 索引 也 是 实现 高 效 访问 所 必需 
的 。 

本 书 详细 介绍 了 允 种 基于 蔽 盘 的 用 于 行 访问 的 绪 构 (比如 散 列 1 和 了 情结 恤 ， 和 这 些 绪 怕 中 
作为 一 个 DBA 必 须 熟 练 掌握 的 许多 特性 {比如 磁盘 空间 管理 }。 还 介绍 了 一 些 折 囊 策 略 处 理 大 容 
量 表 中 使 用 大 量 索 引 的 问题 。 例 如 在 一 个 图 书馆 目录 系统 中 ， 虽然 使 用 大 其 的 索引 可 以 提供 
各 种 高 效 的 查询 ， 但 当 在 表 中 搬 人 新 行 或 删除 旧 行 时 ， 就 要 对 索引 做 大 量 的 奥 新 工作 。 

8. 第 9 章 : 查询 处 理 

在 第 8 章 中 详细 介绍 了 索引 概念 以 后 ， 在 本 章 中 我 们 将 探讨 查询 优化 的 概念 。 忧 化 过 程 是 
由 数据 库 系统 完成 的 。 对 复杂 的 SQL 查询 来 说 ， 很 难 一 步 一 步 地 决定 使 用 什么 样 的 访问 策略 
来 优化 查询 过 程 ， 因 为 查询 过 程 可 能 涉及 基于 不 同 列 值 和 不 同 表 的 多 种 索引 以 及 在 各 个 连续 
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的 阶段 ， 可 以 有 选择 地 使 用 一 批 完 全 不 同 的 访问 技术 。SQL 查 询 语法 具有 一 个 重要 的 特性 ， 
称 为 非 过 程 性 。 这 意味 着 SQL 查询 语法 允许 用 户 只 说 明 希 望 得 到 什么 结果 ， 而 不 必 指 出 如 何 
得 到 结果 ( 也 就 是 说 ， 不 必 按 部 就 得 地 指明 查询 的 过 程 ) 因为 SQL 查询 有 非 过 程 性 的 特点 ， 
所 以 就 有 可 能 把 决定 访问 策略 的 工作 交 给 DBMS 的 查询 优化 模块 去 做 。 这 仍然 是 前 面 提 到 的 
作为 现代 关系 数据 库 管 理 系 统 的 特征 之 一 的 程序 - 数据 独立 的 另 一 个 方面 。 书 写 SQL 查 询 语 
名 的 程序 员 可 以 完全 不 必 有 知道 数据 和 表 索 引 的 物理 结构 。 

本 书 几乎 介绍 了 IBM OS/390 系 统 上 DB2 数 据 库 关 于 查询 优化 的 所 有 内 容 。 由 于 各 个 数据 
库 产 品 在 查询 优化 方面 大 同 小 异 ， 所 以 我 们 只 集中 介绍 其 中 的 一 个 。 不 管 怎么 说 ，DB2 在 查 
询 优 化 方面 表现 出 色 ， 涵 盖 了 其 他 数据 库 产品 在 这 方面 绝 大 允 数 的 特性 。 然 后 ， 我 们 通过 具 
体 艇 说 集合 查询 基准 程序 的 测试 结果 ， 给 出 一 个 扩充 的 例 手 说明 查 调 效率 的 向 题 。 基 准 程序 
是 一 种 工业 标准 测试 ， 用 来 判断 为 某 一 类 特定 用 途 结合 在 一 起 的 不 同 的 硬件 -软件 (DBMS ) 
产 顺 之 则 的 相对 的 性 能 -价格 比 。 集 合 查询 基准 程序 用 来 测试 产业 界 推 出 的 普通 的 查询 应 用 程 
序 的 性 能 价格 比 。 提 出 性 能 价格 比 的 概念 是 为 了 找到 用 来 比较 不 同 的 硬件- 软件 平台 的 一 般 尺 
度 。 通 常 ， 一 种 平台 (如 IBM 大 型 机 上 的 DB2) 的 某 些 特性 很 难 与 男 一 种 平台 { 如 Sun Solaris 计 
算 机 上 的 ORACLE ) 的 某 些 特性 相 比 较 。 每 一 个 厂商 联盟 都 宣称 已 已 的 产品 的 特性 更 优秀 ， 
这 使 得 我 们 难以 判断 。 这 时 ， 就 可 以 用 性 能 价格 比 的 概念 解决 这 个 问题 ， 整 理 在 业界 应 用 中 
有 普遍 用 途 的 一 类 工作 。 为 这 个 工作 设计 若干 测试 单元， 比如 查询 单元 ( 实际 上 是 大 量 的 各 
种 类 型 查询 的 一 个 平均 数 )。 我 们 测试 不 同 平台 为 达到 同一 个 标准 .工作 比率 ( 每 分 钟 查询 
(QPM ) ) 而 耗费 的 美元 价格 {$COST )。 最 后 ， 比 值 $SCOST 4/ QPM 就 可 用 作 不 同 硬件 -软件 平 
台 之 间 比 较 的 尺度 。 

9. 第 10 章 ; 更 新 事务 

对 数据 库 进 行 更 新 访问 和 进行 查询 访问 在 概念 和 技巧 上 存 首 很 太 差 寞 。 当 对 数据 库 知 更 
新 访问 时 ， 我 们 要 确保 所 有 的 更 新 操作 或 者 全 部 成 功 或 者 一 个 也 没有 执行 。 以 下 这 种 情况 是 
不 能 接受 的 :在 进行 转账 操作 时 ， 从 第 一 个 账户 中 成 功 扣 除了 一 笔 球 额 ， 但 由 于 系统 崩 注 的 原 
因 ， 没 有 把 这 笔 款额 加 到 第 二 个 账户 中 去 。 另 外 ， 在 转账 过 程 中 ,单纯 的 查询 应 用 程序 不 能 
计算 这 两 个 账户 的 余额 总 数 。 因 为 此 时 可 能 刚好 从 第 一 个 账户 中 扣除 了 款额 ， 但 还 没有 在 另 
一 个 账户 中 加 上 款额 。 如 果 一 个 人 在 转账 着 程 中 计算 资产 总 值 ， 就 可 能 得 不 到 一 个 正确 的 答 
案 。 为 了 避免 发 生 这 种 问题 ， 提 出 了 数据 库 剖 务 的 概念 :事务 把 一 系列 对 记录 的 读 和 更 新 操作 
组 成 一 个 不 可 分 割 的 包 。 事 务 具 有 原子 性 ， 这 意味 着 事务 所 涉及 的 行 只 能 在 事务 执行 前 或 事 
务 结束 后 才能 被 其 他 操作 访问 。 在 事务 执行 过 程 中 ， 决 不 允许 有 其 他 操作 访问 相关 的 行 。 

要 理 钥 如 何在 一 个 事务 中 打包 一 组 操作 ， 先 得 掌握 其 他 很 兆 复 悉 的 概念 。 从 讨论 能 人 式 
SQL 开始 ， 我 们 初步 介绍 了 三 个 不 同 的 数据 库 产品 提供 给 应 用 程序 员 的 一 系列 SQL 事务 命令 。 
包括 如 何 开 始 和 结束 (或 提交 ) 一 个 事务 。 由 于 直到 第 10 章 才 具 体 展开 更 新 事务 的 详细 内 容 ， 为 
了 使 编写 的 应 用 程序 能 处 理 多 个 更 新 操作 同时 进行 的 情况 ， 我 们 提前 介绍 一 些 这 方面 的 内 容 。 
研究 相互 影响 的 更 新 操作 是 数据 库 系 统 中 关于 集中 控制 的 一 个 重要 领域 ,通常 称 为 事务 处 理 
或 在 线 事务 处 理 (online transaction processing ，OLTP))。 若 干事 务 的 概念 对 于 应 用 程序 编写 
者 来 说 包含 了 重要 的 结论 一 一 例如 事务 异常 中 止 的 概念 。 为 了 保证 事务 的 原子 性 ， 有 时 DBMS 
不 得 不 中 止 事 务 的 执行 ， 回 退 到 现在 为 止 所 做 的 一 切 更 新 ， 并 把 该 事件 通知 给 应 用 程序 。 这 
时 ， 应 用 程序 应 能 处 理 这 类 事件 ， 重 做 该 事务 。 
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在 第 10 童 中， 我 们 探讨 事务 系统 中 并 发 概念 的 理论 基础 。 某 个 事务 在 执行 时 ， 可 能 有 其 
他 用 户 的 事务 试图 访问 ( 称 并 发 访问 ) 正 在 处 理 的 相同 记录 ， 这 时 ， 并 发 控制 要 保证 事务 的 原子 
性 。 并 发 访问 出 于 性 能 因素 是 清楚 的 ， 于 是 ， 由 并 发 引起 的 冲突 就 是 以 最 一 般 的 表达 形式 和 
某 种 众所周知 的 方法 避免 所 述 的 事情 的 发 生 在 实际 应 用 中 ， 这 就 导致 称 为 两 段 镇 (two-phase 
iocking) 的 方案 :; 对 被 茶 个 事务 访问 的 记录 加 锁 ， 以 防止 这 个 记录 被 其 他 并 发 用 户 访 问 ， 一 般 
在 这 个 事务 完成 时 才 对 记录 解锁 。 两 段 锁 法 与 后 面 关 于 性 能 调节 的 概念 密切 相关 。 

在 仔细 研究 了 并 发 控制 以 后 ， 本 书 考 虑 如 何 处 理 在 系统 裔 溃 和 破坏 主 存 内 容 时 已 经 写 人 碰 
盘 的 那 部 分 更 新 操作 。 这 时 候 ， 在 应 用 程序 中 ， 系 统 不 知道 事务 执行 到 了 哪 一 步 。 这 就 是 数 
据 库 恢复 (database recovery) 的 问题 。 为 了 解决 这 个 问题 ， 系 统 会 自动 在 磁盘 上 记录 事务 执行 
的 步骤 。 这 样 当 系统 朋 澳 时 ， 系 统 就 可 以 撤销 属 十 尚未 完成 的 捉 务 的 那些 更 新 操作 ， 把 系统 
焦 复 旬 事 务 执行 前 的 状态 。 

接 下 来 ， 我们 考虑 事务 处 理 的 性 能 问题 。 我 们 将 介绍 一 些 调 节 系统 的 数据 库 管理 命令 和 
由 和 务 人 处 理性 能 协会 (Transaction Processing Performance Council 制定 的 工业 标准 DLTP 基 准 
程序 TPC-A。 很 多 事务 处 理 的 性 能 价格 比 问 题 与 前 面 介 绍 的 查询 处 理 不 同 。 在 第 10 章 中 我 们 
将 详细 解释 这 些 新 概念 。 

10. 第 11 章 :并 行 和 分 布 式 数 据 库 

最 后 ， 在 第 11 章 中 ， 我 们 介绍 并 行 和 分 布 式 数 据 库 处 理 的 概念 。 一 个 数据 库 可 分 解 成 苦 
干部 分 ， 每 一 部 分 都 可 以 存储 在 不 同 的 计算 机 磁盘 上 。 这 样 的 数据 库 系 统 可 以 包含 任意 才 台 
计算 机 。 虽 然 被 分 成 若干 部 分 ， 我 们 仍 希 望 能 对 数据 库 做 查询 和 更 新 操作 ， 这 些 操作 需要 同 
时 访问 雁 于 台 计 算 机 上 的 数据 。 委 使 分 布 式 数据 库 灯 用 这 种 方法 的 一 些 概 念 如 下 :首先 ， 我 们 
希望 如 果 各 地 的 站 点 可 以 在 当地 存储 它们 的 数据 ， 而 不 必 通 过 远 距 离 通信 线 传输 信息 ， 那 么 
系统 的 性 能 价格 比 就 能 提高 。 然 而 此 时 ， 数 据 的 集中 控制 还 是 非常 重要 。 例 如 ， 当 本 地 的 一 
个 大 公司 库存 耗 尽 时 ， 就 得 对 另 一 个 城市 中 的 仓库 发 相关 命令 。 可 靠 性 俏 是 一 个 重要 的 考虑 
因素 。 随 着 数据 库 系 统 包含 的 磁盘 和 处 理 器 数目 的 增加 ， 平 均 无 故障 时 间 (MTTF) 也 变 短 。 提 
高 可靠 性 的 办 法 是 把 数据 复制 到 不 同 的 磁盘 上 ， 使 得 系统 中 独立 的 计算 机 都 可 以 访问 。 以 上 
很 多 央 案 都 是 第 一 次 在 关键 作 务 应 用 程序 中 提 到 。 


1.4 小 结 


在 本 章 中 我 们 介绍 了 本 书 要 讨论 的 基本 概念 和 定义 。 接 下 来 的 几 章 会 深入 讨论 如 何 创建 、 
维护 和 使 用 关系 数据 库 。 我 们 的 目标 是 使 读者 理解 数据 库 理 论 以 及 这 些 理 论 在 现 有 的 数据 库 
标准 和 产品 中 的 应 用 细 市 。 


第 2 章 关系 模型 


一 个 数据 库 模 型 或 者 数据 模型 是 一 组 描述 如 何 用 计算 机 化 的 信息 表示 现实 世界 中 数据 的 
定义 。 它 同时 也 描述 了 访问 和 更 新 这 些 信 息 的 操作 类 型 。 第 1 章 中 己 经 说 过 ， 本 书 将 侧重 点 旅 
在 了 关系 模型 和 对 象 -关系 模型 上 。 从 20 世 红 70 年 代 未 就 开始 使 用 的 关系 模型 是 最 为 经 典 的 一 - 
种 数据 库 模 型 。 但 是 大 多 数 的 数据 库 系 统 厂 商 (比如 ORACLE、DB2 UDB 和 和 和 INFORMIX) 在 它 
们 最 近 发 布 的 版 本 中 已 经 开始 支持 对 和 象 - 关 系 模型 ;也 许 在 不 久 的 将 来 ， 所 有 重要 的 数据 库 三 
商都 将 这 么 做 。 在 这 两 种 模型 中 ， 数 据 库 ， 也 就 是 相关 信息 的 集合 ， 是 用 一 组 表 米 表示 的 。 
这 些 “ 表 ”有 着 非常 严格 的 概念 结构 。 表 中 的 各 种 不 同 结 构 是 如 何 命 名 的 {如 表 的 标题 )， 表 所 
遵循 的 结构 规则 (如 表 中 的 两 行 元 素 在 列 上 的 值 不 能 全 部 相同 ) 以 及 这 些 规 则 用 于 数据 访问 时 一 
生 的 概念 (如 一 个 表 的 主键 是 表 中 能 够 唯一 标识 行 的 列 的 集合 } 都 将 是 我 们 讨论 的 重点 。 本 章 
的 前 四 节 将 讲述 关系 模型 的 一 些 结构 上 需要 考虑 的 东西 ， 以 及 和 对 象 -关系 模型 的 区 别 。 关 于 
对 象 - 关 系 模型 的 细节 部 分 我 们 将 在 第 4 章 做 详细 讨论 。 

从 2.5 节 开始 ， 我 们 将 介绍 关系 代数 。 关 系 代 数 是 由 一 系列 最 基 杰 的 关系 操作 组 成 ， 它 可 
以 于 来 从 旧 表 中 建立 新 表 ， 就 像 在 算术 上 用 加 法 或 者 乘法 就 可 以 产生 新 的 数 一 样 。 关 系 代 数 
是 一 种 抽象 的 语言 ， 这 意味 着 无 法 在 一 台 具 体 的 计算 机 上 执行 用 关系 代数 形式 化 的 查询 。 之 
所 以 在 本 章 引 人 和 人 关系 代数 ， 是 为 了 用 最 简单 的 形式 来 表达 ， 所 有 关系 数据 库 查 询 语 言 为 了 加 
等 用 英语 所 表达 的 对 数据 库 中 信息 的 查询 而 必须 采用 的 操作 的 集合 。 所 有 这 些 基本 概念 对 于 
在 以 后 的 章节 中 我 们 介绍 关系 数据 库 系 统 的 标准 查询 语言 SQL 是 非常 有 用 的 。 

本 章 和 包含 的 大 量 的 数学 定义 和 定理 ， 因 此 相对 于 后 面 的 关于 查询 语言 的 的 部 分 章 节 来 说 ， 
本 章 的 组 织 用 了 非常 抽象 的 方法 。 这 一 点 是 有 很 多 原因 的 。 首 先 ， 在 介绍 某 个 领域 的 最 基本 
的 概念 的 时 候 当 然 是 尽 可 能 做 到 准确 ; 而 更 为 重要 的 是 ， 对 于 从 事 正 规 数据 库 人 研究 的 人 人员 来 
说 有 时 候 需要 能 在 不 间 类 型 的 表达 中 相互 变换 。 太 多数 的 商业 化 的 数据 库 产 品 ， 如 DB2 UDB 、 
ORACLE 和 INFORMIX 都 提供 了 一 本 极其 精美 的 手册 ， 用 于 说 明 实际 数据 库 操作 中 可 能 出 现 
的 不 同 概念 ， 然 而 ， 还 是 有 一 定数 基 的 更 深层 次 的 概念 是 这 些 手 册 所 无 法 包括 的 。 为 了 掌握 
这 些 概念 ， 数 据 库 的 使 用 者 还 是 需要 去 查阅 参考 书 或 者 原始 的 研究 论文 。{( 例 如 ， 可 以 参阅 本 
章 最 后 的 “推荐 读物 ”)。 在 这 里 ， 我 们 使 您 在 阅读 那些 更 为 抽象 的 参考 帘 料 之 于 先 营 握 -- 些 
基本 的 知识 。 


2.1 CAP 数 据 库 


正如 我 们 在 1.1 节 中 提 到 过 的 那样 ， 数 据 闫 是 为 了 某 个 特殊 目的 存储 在 - :起 的 相关 数据 记 
录 的 集合 。 在 以 下 的 章节 里 将 使 用 一 个 特殊 的 数据 库 例 子 ， 我 们 称 之 为 CAP 数 据 库 ( 由 表 
CUSTOMERS，RAGENTS 和 PRODUCTS 组 成 )。CAP 数 据 库 表 显 示 在 图 2-2 中 ， 批 发 商用 它 来 记 
录 他 们 的 顾客 、 商 品 和 接受 顾客 订单 的 代理 商 的 信息 。 

图 2.2 的 CAP 数 据 库 中 的 表 结 构 信 息 显示 在 图 2-1 中 。 表 中 所 列 的 顾客 是 从 批发 向 那里 批发 
大 量 商 品 然 后 自己 转 销 的 零售 商 。cCUSTOMERS 中 的 顾客 用 cid( 左 客 标 识 符 ) 属 性 作为 唯一 标 


带 2 介 关系 机 型 17 


识 。 顾 客 向 代理 商 ( 在 表 aGENTS 中 用 aia 属 性 唯一 标识 ) 要 求购 买 商 师 ( 在 袁 BRODUCTS 中 用 
pia 唯 一 标识 )。 每 次 订货 都 会 在 珍 ORPERS 中 增加 一 条 订单 记录 ， 用 orano 了 唯一 标识 该 记录 。 
比如 ， 在 表 CRDERS 中 ordane 为 1011 的 订单 表示 是 在 一 月 份 (jan) 由 顾客 c001， 通 过 代理 商 
a01i 购 了 1000 份 商 目 pD1， 价 值 $450。 图 2-1 提 供 了 CAP 数 据 库 中 所 有 的 考 和 列 的 定 久 ， 而 这 
些 表 中 的 内 和 窜 显示 在 图 2-2 中 (这 些 内 容 可 能 和 随时 间 改 变 )。 


CUSTOMERS 存 亦 闫 客 傅 息 的 埠 
唯一 标识 一 个 顾客 所 7 一 一 注意 表 哆 内 容 中 屋 有 cjic 为 
‘cD05" 的 相关 顾客 
cname 顾 寄 的 名 称 
city 亚 寄 所 在 的 城市 
discnt 每 个 顾客 可 能 会 有 的 拆 扣 
AGENTS 存放 羽 型 商 信息 的 由 
aid 唯一 恒 记 一 个 代理 商 / 行 
aname 代理 南 的 他称 
city 代理 商 所 在 的 城市 
percent 每 笔 党 易 代 理 所 能 获得 的 俩 金 万 分 比 
PRODUCTS 存放 商 几 信息 的 表 
pid 唯一 标识 “= 件 南 闻 ! 行 
pname 商品 的 名 称 


Cid 


city 商品 库存 所 在 的 城市 

quantity 月 前 可 篆 此 的 商品 库存 数量 

price 每 单位 商 册 的 批发 从 
请 注意 ; 在 到 月 前 为 止 己 定 吕 的 所 有 = 个 表 中 ， 肯 有 相同 的 州 名 ci cy ， 这 不 二 俩 然 的 事情 ， 
“者 的 言 交 不 同 。 


DRDERS 存放 订单 信息 的 表 
ordno 唯一 标识 --- 份 订单 
month 订单 月 份 ， 息 设 所 有 的 订单 址 其 本 年 度 的 一 上 月 份 开 始 的 
cid 购买 商品 的 顾客 
aid 经 由 该 代理 商 订 货 
pid 所 订 网 的 商品 
qty 订购 的 商品 数量 
do1T1ars 商品 的 总 价 
图 2-1 CAP 数 据 库 中 表 各 列 的 定义 


注意 ， 数 据 库 管理 员 创 建 cia 刚 为 艳 客 的 唯一 标识 符 ， 而 没有 其 他 单独 列 能 够 满足 该 要 
求 。 比 如 ， 属 性 cname 在 不 同 的 行 上 可 能 有 相同 的 值 ( 并 日 实 际 上 “ACME” 就 是 出 现在 不 同 
的 行 上 )。 同 样 的 ,aia、pia 和 erdqno 属 性 在 它们 对 应 的 发 中 定义 为 唯一 的 标识 符 。 
DRDERS 表 中 的 4o1l1ars 值 可 以 从 qty 和 price 两 个 值 通 过 简单 的 相 乘 ， 然后 计算 给 顾客 所 
打 的 折 扩 (根据 cid 所 对 应 的 CUSTOMERS 表 中 的 discnt 属 性 可 得 } 而 得 到。 我 们 也 不 需要 再 减 
掉 给 代理 商 的 情人 金 ， 因 为 已 经 假定 seltars 代 表 了 对 顾客 来 说 的 所 有 开销 。 

这 个 CAP 数 据 库 的 例子 非常 简单 ， 并 月 人 工 的 痕迹 比较 的 明星， 但 是 非常 适合 做 标书 的 
合子 来 说 明 我 们 的 思想 。 如 果 是 为 了 更 吉 符 合 事 实 的 话 ， 那 么 我 们 就 需要 考虑 更 多 、 里 太 的 
表 ， 首 先 我 们 需要 更 多 的 列 。 例 如 ，aGENTS 表 中 的 aname 应 该 还 有 和 名字; 每 个 city 列 还 必须 





18 数据 诽 原 理 、 编 程 与 性 能 


加 上 附属 的 街道 、 州 和 邮政 编码 等 列 ;我 们 还 需要 记录 所 有 的 代理 商 在 最 近 的 几 个 月 里 的 销售 
人 情况， 就 好 像 我 们 需要 记录 目前 手头 上 还 剩 的 商品 的 数 有 日 ;我 们 需要 记录 每 个 顾客 公司 中 的 联 
系 人 的 和 名字、 掌管 库存 的 人 员 的 名 字 、 企 址 、 电 话 号 码 等 等 ; 我 们 可 能 还 党 要 每 个 订单 的 更 
完整 的 日 期 和 时 间 融 (只 有 月 份 是 不 够 的 ); 我 们 可 能 还 需要 记录 人 员 的 报酬 ; 也 有 可 能 有 不 在 
代理 商 处 了 作 的 员工 ， 我 们 还 需要 为 他 们 另外 记录 工资 、 赋 税 等 等 的 铺 况 ; 我 们 也 需要 在 表 
中 包含 点 多 的 行 。 


CUSTOMERS PRODUCTS 

pid | pname | city | quantity | price | 

co0l | TipTep | Duluth j 10,.00 pP01 | comb 111400 0.50 

oor | eve | pus [wo0 

oe | revs | oo | 000 
aa amo0 00 


ORDERS 

ro [mmm ee [ro pie] ary | eare | 
on [en | eon | oo ror Tio00 | as000 
om [ian | eo0r | 01 [007 | 1000 | 450.00 


180,0U 
540.00 
540.00 
4 30.00 
720.00 
720.00 
S80.00 
704.00 
1104.00 
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图 2-2 _ CAP 数据 库 { 某 一 时 刻 的 内 容 } 


2.2 数据 库 各 部 分 的 命名 


数据 库 中 有 两 套 标 准 术语 。 一 套用 的 是 表 、 列 . 行 ; 而 厅 垃 的 另外 -一 种 就 用 关系 (对 应 表 )、 
元 组 (对 应 行 }， 属 性 (对 应 列 )。 我 们 将 同时 使 用 这 两 套 术 语 ，、 以 便 你 很 容易 地 识别 。 因 此 我 们 
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会 经 常用 表 的 列 名 指 代 该 表 的 属性 (如 表 cUSTOMERS 的 属性 包括 cid、cname、city 利 
aiscnt)， 用 表 的 行 来 指 代表 中 的 元 组 。 

数据 库 是 表 或 韦 涪 是 关系 的 集合 。 比 如 CAP 数 据 库 由 下 列表 的 集合 组 成 : 

CAP = {CUSTOMERS, AGENTS, PRODUCTS, ORDERS} 

表 的 标题 是 表 的 列 名 集合 ， 它 出 现在 表 的 最 上 部 ， 位 于 表 的 第 一 行 {( 也 就 是 元 组 ) 的 上 谭 。 
表 工 的 标题 用 HeadfT) 标 记 。 比 如 ， 

HeadtLUSTOMERS) = [eid, chame, city, discnt} 

在 列 出 标题 的 列 集 合 的 时 候 ， 划 于 标记 ({xX，y7，.…… 力 有 一 个 约定 的 简化 写法 ， 可 以 简单 地 
列 出 这 些 属性 ， 用 空格 隐 开 。 因 让 更 通用 的 标题 写法 是 ; 

Eeadt CUSTOMERSY = Cid cndame City discnt 

表 的 标题 也 被 称 做 关系 衬 式 ,剧组 成 关系 的 属性 的 集合 。 数 据 库 的 所 有 关系 模式 的 集合 
构成 了 数据 库 模 式 。 

表 的 行 集合 ， 也 就 是 元 组 集合 ， 称 为 表 的 内 容 ， 表 的 行 数 称 为 表 的 基数 。 比 如 ， 图 2-2 中 
的 PRODUCTS 表 包含 了 7 行 数据 。 值 得 注意 的 是 ， 表 和 名 以 太 表 的 标题 是 表 长 期 存在 的 属性 ， 而 
表 的 行 集合 在 数量 和 详细 值 方 面相 对 而 言 是 时 常 变化 的 ， 这 就 是 我 们 为 什么 在 图 2-2 中 要 称 表 
的 内 容 是 相对 于 “ 某 一 时 刻 ” 的 原因 。 对 于 熟悉 CC 和 Java 编 程 的 读者 米 说 ， 类 似 图 2-2 的 胡可 
以 被 看 做 储存 记录 或 者 结构 的 文件 ， 表 中 的 每 一 行 数据 一 般 说 对 应 文件 中 的 一 条 记 送 。 记 还 
中 的 字段 的 结构 也 可 以 由 表 的 标题 确定 ， 然 而 在 关系 数据 库 依 据 程序 -数据 独立 的 原则 施用 程 
序 编 程 人 员 与 具体 的 存 鱼 是 完全 疫 离 的 ， 数 据 库 在 理论 上 可 以 用 各 种 完全 不 同 的 磁盘 结构 来 
鱼 存 表 中 的 行 。 

1. 域 和 数据 类 型 

表 必 须 建立 在 一 个 计算 机 化 的 数据 摩 系 统 之 上 (也 就 是 说 ， 空 表 的 结构 必须 预先 声明 )， 号 
像 表 所 包含 的 记录 ( 针 构 ) 需 要 用 C 或 者 Java 声 明 。 在 目前 的 数据 库 产 品 { 如 ORACLE、DB2 
UDB 以 及 INFORMIX) 中 ， 表 中 的 列 必 须 有 特定 的 类 型 。 比 如 说 ， 表 CUSTOMERS 中 的 aisgcnr 
列 的 类 型 是 real( 实 型 一 一 占 四 字 节 的 浮 点 数 )， 并 且 city 列 的 类 型 为 char(13){ 长 度 为 13 的 字符 
串 )。 在 理论 性 交 献 中 ， 更 一 般 地 说 ，、 表 T 的 属性 A 的 取 值 范围 是 在 集合 D 上 ， 我们 称 记 为 域 。 
域 一 般 定义 为 可 以 被 用 作 表 的 属性 值 的 常数 的 集合 ， 因 此 域 在 某 些 编 程 语言 中 通常 对 应 于 一 
些 特 定 的 榴 举 类 型 的 概念 。 比 如 属性 city 的 域 { 用 cITY 表 示 }) 可 能 是 代表 美国 (假定 我 们 的 公 
司 只 和 在 美国 的 客户 有 业务 往来 ) 所 有 的 城市 的 字符 串 的 集合 。 在 另 一 力 而 ， 属 性 di scnt 的 
域 DfScNT 可 能 被 定义 为 从 0.00 到 20.00 的 实数 集合 ， 并 且 可 能 这 些 实数 必须 精确 至 小数点 后 
两 位 { 它 表示 了 我 们 的 代理 商 们 给 他 们 的 顾客 所 打 的 折扣 的 范围 )。 

大 多 数 商 业 数 据 库 系统 都 支持 小 数位 数 的 显 式 精确 度 (比如 DISCNT)， 而 不 支持 出 枚 举 集 
合 组 成 的 类 型 (比如 CITY)。 我 们 通常 不 得 不 满足 于 这 样 的 系统 ， 也 就 是 在 city 列 中 出 现 的 值 
属于 char(13) 这 样 的 原始 类 型 。 然 而 把 类 似 于 char(13) 这 样 的 域 限制 在 出 现在 男 外 一 个 表 的 列 
中 的 校 举 值 的 集合 是 可 能 的 。 通 过 使 用 约束 类 型 也 就 是 第 7 章 中 要 讲述 的 引用 完整 性 我 们 可 以 
轻易 地 做 到 这 一 点 。 

绍 表 的 列 加 上 一 个 特定 的 类 型 的 意义 在 于 ,我 们 可 以 对 声明 在 该 类 型 上 的 两 个 不 同 的 列 
的 值 进行 比较 。 举 个 例子 ， 如 果 CUSTOMERS 表 的 city 列 的 值 声明 为 类 型 char(13)7， 而 
aGENTS 表 的 city 列 的 值 声明 为 类 型 char(14)， 那 么 对 于 要 求 将 所 有 的 在 同一 个 城市 的 代理 顾 
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客 对 打印 输出 的 请 求 就 无 法 肯定 得 到 结果 ， 央 为 理论 上 说 数据 库 系 统 可 能 会 拒绝 在 不 同类 型 
的 列 之 间 进 行 比较 。 

2. 表 和 关系 

首先 我 们 回顾 一 下 稍 卡 儿 积 这 个 数学 概念 。 

定义 2.2.1 简 卡 儿 积 ”集合 $5，5;，…。5 的 笛 卡 儿 积 $, x5-x…x5. 和 由 有 所 有 的 #0 组 (e,， 
2,，-…， 包 组 成 ， 这 里 e 是 5 中 的 任意 元 素 ，e; 是 5 中 的 侍 意 元 素 ，.…，e, 是 $5. 中 的 任意 元 系 。 轩 


慨 设 集合 CID，CNAME，CITY 和 DISCNT 分 别 代 表 了 表 cCUSTOMERS 中 的 属性 cid，cname， 
city 和 digscnt 的 域 。 属 性 A 的 域 用 Domain(A) 表 示 ， 所 以 Domain(cid)=CTD， 如 果 c 人 允许 作为 
cid 列 的 值 ， 那 么 我 们 就 有 ce CTD。 现 在 我 们 来 考虑 集合 CID，CNAME，CITY 利 DISCNT 的 第 卡 
儿 积 : 

Cp = CIB x CHAME x CIETY x D1SCHT 

笛 卡 儿 积 cP 由 所 有 可 能 的 四 元 组 :=(c，n，t，d) 组 成 ， 这 里 c 是 C1D 中 的 顾客 的 标识 号 ，n 
是 cNaAME( 不 一 定 对 应 于 标识 符 为 c 的 顾客 ) 中 的 顾客 名 称 ， 十 cITY 集 人 台中 的 茶 个 关 国 城市 名 ， 
d 是 DISCNT 中 的 某 个 值 。 比 如 ， 币 卡 儿 积 cP 将 包 会 下 面 的 元 组 : f=(c003,，Allied，Dallas,， 
8.00) 和 f=(c001, Basics, Oshkosh, 18.20)。 

现在 关系 是 一 种 数学 结构 ， 被 定义 为 一 个 箔 卡 儿 积 的 子 集 。 比 如 ， 表 CUSTOMERS 吓 
CP=CID x CNAME x CITY x DISCNT 的 一 个 子 集 。 表 CUSTOMERS 中 的 所 有 行 {也 就 是 所 有 的 4 
元 组 ) 都 包 仿 在 销 卡 儿 积 cP 所 表示 的 元 组 的 集合 当中 了 。 对 于 上 面 那 两 个 元 组 ，1 包 含 在 
cUSTOMERS 中 ， 面 tf 不在。 因此 ， 宕 CUJSTOMERS 是 真子 集 一 一 没有 和 包含 箔 上 攻 儿 积 中 的 所 有 元 
素 的 子 集 ， 因 为 并 不 是 所 有 人 身 卡 儿 积 的 九 素 都 是 关系 中 的 元 素 。 我 们 称 那 些 符合 条 件 的 箔 十 
儿 积 中 的 元 素 为 相关 的 ， 并 由 此 得 到 数学 上 的 术语 一 一 关系 。 特 别 需 要 注意 的 是 表 中 的 每 … 
行 都 与 不 同 的 列 上 的 秆 相关 联 ， 所 以 表 中 的 行 的 完整 集合 才 被 称 为 一 个 关系 。 

如 图 2-1 中 所 示 ， 每 一 个 顾客 都 假定 拥有 唯 - -的 cigd 值 ， 因 此 包含 所 有 第 卡 儿 积 元 素 的 
CUSTOMERS 表 是 没有 任何 意义 的 。 只 要 CNAME，CITY 和 DISCNT 中 有 一 个 域 中 包含 超过 一 个 
值 ， 稍 卡 所 积 中 必然 包含 两 行 在 cID 列 上 具有 相同 的 值 , 但 是 cuUSTOMERS 表 中 cID 列 的 值 对 
于 不 同 的 行 依旧 保持 唯 --。 

秽 2.2.1 使 用 刚 引 入 的 术语 ， 如 果 我 们 定义 一 个 表 T 的 标题 为 

Head(T)=Al-.…A, 
那么 表 T 将 是 Domain(A1)，…，Domain(A,) 的 币 卡 儿 积 的 -个子 集 。 加 

前 面 提 到 过 . 表 的 标题 是 相对 稳定 的 ， 它 描述 了 表 的 行 的 结构 。 增 加 或 者 删除 列 都 不 号 
很 常见 的 ,我们 也 不 希望 在 日 常 业 务 中 这 人 么 做 。 在 设计 表 的 列 布局 的 时 候 .， 我 们 必须 根据 数 
据 库 的 需求 做 好 全 面 的 分 析 。 第 1 章 已 经 讲 过 ， 这 一 步 称 为 数据 库 的 逻辑 设计 . 

另 一 方面 ， 表 的 内 容 是 经 常 变 化 的 ， 新 的 行 可 以 随时 被 增加 或 者 删除 。 当 我 们 新 增 -一 个 
客户 的 时 候 我 们 可 以 在 数据 库 中 湛 加 一 行 数据 ; 当 我 们 失去 一 个 顾客 的 时 候 ， 我 们 可 以 在 数 
据 库 中 删除 对 应 的 行 。 在 大 型 的 批发 公司 中 跟踪 这 些 数据 的 变化 是 不 可 能 的 因为 有 些 表 可 能 
有 上 再 万 条 记录 ;但 是 列 的 数量 一 般 来 说 被 限制 在 一 定 的 范围 之 内 。 用 户 不 需要 特殊 的 知识 ， 
只 要 知道 列 的 名 字 和 特性 就 可 以 通过 查询 语 吉 检 索 一 个 或 者 多 个 表 的 行 的 仿 息 。 旭 果 你 认为 
一 个 查询 的 准确 铺 果 和 查询 所 涉及 到 的 表 的 内 容 有 关 ， 那 么 你 就 错 了 。 像 CAP 这 样 的 小 型 数 





带 2 半 关系 楼 邢 27 


据 库 是 例外 的 :你 可 以 利用 CAP 中 的 表 的 内 容 去 检验 查询 结果 是 省 符合 要 求 。 然 而 ， 查 询 正 确 
性 最 终 的 测试 要 求 对 表 内 容 的 所 有 可 能 的 改变 能 得 到 正确 的 结案 。 


2.3 关系 规则 


关系 模型 中 一 些 众所周知 的 规则 告诉 我 们 在 表 结 构 中 哪些 变化 是 允许 的 ， 哪 些 检索 操作 后 
受 限 的 。 这 些 关 系 规 则 在 各 种 不 同 的 商业 数据 库 产 品 的 标准 化 工作 方面 起 到 了 很 大 的 作用 ， 因 
此 逻辑 数据 库 设计 (第 6 章 将 学 习 ) 的 一 些 概 念 对 于 这 些 产 品 来 说 是 完全 ' 样 的 。 很 多 了 商业 化 的 数 
据 库 产品 在 日 的 地 打破 了 某 些 关系 规则 ， 而 新 的 对 象 -关系 数据 库 模 型 更 甚 ， 正 因为 如 此 ， 读 
者 应 该 对 于 下 面 将 要 讲述 的 概念 保持 充分 的 警觉 ， 对 你 期 望 在 某 些 商业 数据 库 系 统 中 过 到 的 变 
化 应 保持 灵活 。 

规则 1 第 一 范式 规则 在 定义 的 表 中 ， 关 系 模型 坚持 不 允许 会 有 多 值 属性 (有 时 称 为 重复 
字段 ) 和 含有 内 部 结构 (比如 记录 类 型 ) 的 列 。 遵 守 这 样 规则 的 表 称 为 第 一 范式 。 图 

作为 一 个 例子 ， 考 虑 图 2-3 中 表 EMPLDYEES， 它 包 会 对 应 公司 雇员 的 行 。 表 中 依 有 唯一 
的 雇员 标识 列 sida、 雇 员 的 名 字 ename、 鹿 员 在 公司 的 职位 pesiktion 以 及 一 个 多 值 字 段 ( 属 
人 性) 列 出 了 该 雇员 的 家 属 。 比 如 ID 为 e001 的 雇员 John Smith 有 两 个 家 属 ，Michael J 和 Susan R.， 
被 分 列 在 不 同 的 行 上 ， 而 David Andrews 有 一 个 家 属 ，Frankilin Jones 风 有 一 个 。 


EMPLOYEES 
eid | ename | position | dependents 
Michacl 了 
Smith, John Apent 


Mndrews, David David M. Jr. 


Andrew K. 
ed03 | Jones, Franklin Agent 


图 2-3 具有 客 值 属性 别 aepenqents 的 FMHPLOYEE3S 表 
关系 规则 1 点 明 图 2-3 中 的 重复 字段 aependentes 在 关系 表 中 是 不 允许 的 。 这 是 在 设计 过 
程 中 的 一 个 约束 , 如 果 我 们 点 把 家 属 名 放 人 入 表 EMPLOYEES( 如 图 2-4 所 示 ) 中 的 唯一 的 雇员 行 中 ， 
我 们 需要 给 表 建 立 :定数 目的 察 属 列 ， 这 个 数 日 要 达到 某 一 雇员 可 能 有 的 最 党 的 家 属 数 ， 比 


dependent1l, dependent2, +..., dependent20。 











EMPLOYEES 


iq ETm af 所 position 
ave Dava | sopermemien | Dos | | 


图 2-4 每 个 雇员 行 中 其 有 多 列 家 属 溃 的 EMPLOYEES 表 


但 是 这 是 不 切实 际 的 ， 因 为 它 浪费 空间 并 使 得 查询 变 得 非常 国难 .所 以 一 个 有 鸡 的 方法 
是 将 表 EMP LOYEES 分 解 成 两 部 分 ， 建 立 单独 的 表 DEPFNDENTS， 该 表 包 仿 两 列 ，eid 和 和 
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dependent({ 如 图 2-5 所 示 )。 
EMPL OYEES QEPENDENTS 


position | eld | dependent 


| 


Smith, John e001 | Michael]. 


图 2-5 表 EMPUGOYEES 和 相应 的 表 DEPFNDENTS 


表 DEPENDENTS 每 一 行 对 应 一 个 家 属 ， 给 每 个 eid 一 个 雇员 -家 属 名 字 对 。 等 一 会 我 们 将 
会 看 到 ， 任 何 关 系数 据 库 的 查询 语言 都 介 许 我 们 将 一 个 雇员 行 和 拥有 相同 eiad 的 家 属 行 连接 
起 来 。 

第 一 范式 规则 同时 也 要 求 任 何 烈 的 人 秆 都 必须 是 简单 类 型 ， 不 允许 包含 内 部 结构 。 比 如 图 
2-5 中 表 EMPLOYEES 的 ename 列 是 由 简单 的 字符 串 组 成 的 ， 通 过 -- 些 分 隔 符 来 构成 姓 ( 喜 号 前 
的 所 有 交 本 Y。 我 们 不 允许 建立 一 个 带 有 含 ename. fname、ename. lname 和 ename .mi[( 分 
别 对 应 姓 、 名 和 姓名 首 字 母 三 个 组 成 部 分 的 列 的 表 ， 因 为 在 第 一 范式 中 不 允许 革 一 列 的 值 是 
结构 类 型 。 

我 们 曾经 简单 地 提 过 ， 第 一 范式 规则 可 以 被 对 象 -关系 数据 库 系 统 中 定义 的 表 所 打 酸 。 这 
些 表 是 非 第 一 范式 (non-first normal form，NFNF)。 在 第 4 章 我 们 会 计 论 对 象 - 关 系 模型 的 细节 。 
打破 第 一 范式 规则 的 途径 是 该 模型 多 许 表 中 对 象 列 的 值 是 包含 一 个 复杂 类 型 值 的 集合 比如， 
我 们 可 以 为 person_name 新 定义 一 个 类 型 包 合 数 个 字符 串 的 成 分 fname，lname 和 mi， 然 
后 可 以 定义 -一 个 dependent_ names 类 型 为 .setof (person_ name) ,这样 声明 为 
dependen t_names 类 型 的 列 就 可 以 包含 复杂 名 字 的 集合 了 。 

规则 2 ”只 能 基于 内 容 存 取 行 规则 关系 模型 的 第 二 条 规则 说 明 我 们 只 可 以 通过 行 的 内 容 
即 每 一 行 中 所 存在 的 属性 值 来 检索 列 。 国 

就 目前 用 户 的 查 调 而 将 ， 规 则 2 说 明了 行 是 没有 次 序 的 。 因 此 任何 一 个 ( 纯 ) 关 系 查 询 语言 
都 不 可 以 要 求 检 索 表 CRDERS 中 的 第 三 行 ， 取 而 代 之 的 应 该 是 要 求 查询 cordno 列 为 10195 的 行 ， 
根据 图 2-1 中 rdane 的 定义 ， 该 行 是 唯一 的 。 在 其 种 意义 上 讲 ， 图 2-2 中 所 显示 的 ORDERS 表 可 
能 会 误导 读者 。 根 据 规则 2， 表 ORDER3S 是 没有 第 一 行 、 第 二 行 或 者 是 第 三 行 之 分 的 ， 由 表 中 
行 组 成 的 表 的 内 容 是 集合 的 无 序 元 素 。 用 更 抽象 的 数学 术语 来 说 ， 可 以 简单 地 表述 为 关系 是 
元 组 的 集合 。 规则 2 的 男 外 一 个 含义 是 你 无 法 建立 一 个 指向 行 的 指针 以 便 以 后 可 以 再 次 检索 它 ， 
这 种 指针 是 不 允许 的 。 

有 些 和 商业 数据 库 系统 甚至 连 规 则 2 都 打破 了 ， 首 过 行 标识 (row identification，RID) 提 供 一 
种 用 户 检 索 表 中 的 行 的 方法 ， 通 常 把 行 标 识 称 为 ROWID( 读 作 row-eye-dee)， 上 成 者 称 为 元 组 标 
识 (TID， 读 作 tee-eye-dee)。 在 一 般 情 况 下 ，RID 可 以 很 容易 在 数据 被 导入 数据 库 的 时 候 通 过 
行 的 数 自 计 算出 来 。 商 业 数 据 库 系 统 常 声称 规则 2 是 不 合理 的 ， 需 要 一 个 新 的 标准 。 为 了 确保 
可 以 通过 RID 值 来 访问 数据 行 ， 需 要 把 数据 库 中 的 行 以 特定 的 实际 次 序 季 依 在 非 易 失 性 的 介 
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质 上 ， 比 如 磁盘 { 非 易 失 性 指 的 是 机 器 的 电源 供应 中 止 的 时 候 介 质 仍 然 可 以 保持 数据 )。 数 据 
存储 的 次 序 是 可 以 预见 的 ， 在 第 7? 章 可 以 看 到 ， 通 过 RID 检 索 数 据 对 于 数据 库 管 理 员 (DBA) 来 
说 是 非常 有 用 的 。 它 可 以 帮助 数据 库 管理 员 检查 在 什么 地 方 表 中 的 行 记 赤 没有 按 正 确 的 方式 
存放 。 有 目前 的 磁盘 存储 技术 显示 数据 行 互 相 之 则 存放 得 越 近 ， 检 索 数 据 越 快 。 我 们 可 以 在 本 
书 的 后 面部 分 检验 其 正确 性 。 总 而 言 之 ，RID 的 值 是 很 重要 的 ， 我 们 不 需要 考虑 行 沁 录 存 储 
的 实际 次 序 。 同 时 ， 太 多数 的 用 户 是 不 会 对 RID 的 值 进 行 查询 的 ， 因 为 RID 的 值 当 表 在 特定 场 
合 下 更 新 以 后 随 之 发 生变 化 。 

对 每 -关系 寞 型 允许 革 一行 上 列 值 指 向 另外 一 行 ， 这 和 关系 规则 是 严重 违背 的 。 

值得 注意 的 是 ， 关 系 模型 同样 也 要 求 在 一 个 关系 中 的 列 是 没有 次 序 的 。 因 此 我 们 上 绸 一 次 
要 说 明 我 们 所 提供 的 表 模型 是 有 误导 和 作用 的 。 标 准 的 SQL 语 言 打破 了 这 项 规则 ， 我 们 在 第 3 章 
各 以 认识 到 这 一 点 。 

规则 3 “” 行 唯一 性 规则 关系 模型 的 第 三 条 规则 要 求 关系 中 的 任何 两 个 元 组 ( 表 中 的 行 ) 的 
值 在 同一 时 刻 不 能 是 完全 相同 的 。 关 系 可 以 被 看 做 是 关系 模型 中 的 元 组 的 集 售 ,理所当然 集 
合 是 不 介 许 包含 相同 元 素 的 ， 人 和 集合 中 的 任意 元 组 必须 唯一 。 而 且 ， 出 于 纯 闫 系 查 询 语 言 只 能 
通过 它们 的 列 值 来 区 分 行 (规则 2)， 这 也 说 明了 必定 有 另 一 个 方法 可 以 区 分 任何 一 行 数据 各 其 
他 的 行 的 值 ， 这 样 查询 语言 语句 就 可 以 唯 -- 的 检索 出 它 来 。 本 

在 商业 数据 库 系 统 中 ， 很 大 一 部 分 工作 要 求 保 证 在 插入 一 条 新 记录 的 时 候 ， 原 数据 库 中 
没有 相同 的 记录 存在 。 和 而 行 的 唯 -性 规则 也 正 是 大 多 数 情 况 下 合理 的 目标 。SQL 中 的 Create 
Table 语 名 如 果 设 有 特殊 的 限制 (维护 起 来 花 销 更 大 ) 的 话 并 没有 铝 证 这 一 点 。 在 本 章 讲 述 的 关 
系 模型 当中 ， 行 的 唯一 性 规则 具有 特殊 的 含义 ， 因 此 在 以 下 的 讲述 当中 ， 如 果 设 有 特别 指明 ， 
我 们 者 假定 所 有 的 表 都 遵守 规则 3。 这 个 假定 到 我 们 讲述 商业 数据 库 系 统 中 的 表 为 止 。 

关系 规则 的 动机 是 什么 昵 ?这 些 规 则 { 到 及 其 他 的 ) 在 关系 模型 的 发 明 者 已 "FE ' Codd 的 一 
系列 文章 中 就 担 出 了 。 这 些 规 则 反映 了 特定 的 数学 假定 ， 对 于 关系 结 格 的 良好 性 状 有 重大 
意义 。 在 随后 的 章节 中 我 们 将 使 用 大 量 的 例子 。 绕 如 ， 规则 3， 扩 暴 了 这 样 的 一 个 数学 思 
想 : 关 系 是 元 组 的 集合 ， 集 合 不 可 以 包含 相同 的 元 素 。 规 则 1， 从 图 2-3 到 2-$ 可 以 看 出 ， 对 于 
数据 库 表 的 设计 具有 相当 大 的 意义 。 规 则 2， 要求 只 能 通过 行 的 内 容 来 访问 行 ， 保 证 了 本 章 
稍 后 提供 的 丛 索 行 的 方法 是 唯一 被 允许 的 方法 。 因此， 一 些 关 系数 据 库 以 前 的 数据 库 产品 
不 能 通过 简单 弛 定义 几 个 表 来 局 存 数据 ， 保 持 它 们 原先 的 数据 访问 方式 ， 也 无 法 再 称 之 为 
关系 产品 。 就 如 前 面 所 提 到 的 一 样 ， 关 系 规则 在 各 产品 的 标准 化 方面 起 到 了 很 重要 的 作用， 
它 保 证 了 在 不 同 的 系统 中 的 数据 库 设 计 的 规则 者 相同。 出 现 新 的 对 象 -关系 模型 是 因为 很 多 
和 人 认为 处 于 数学 动机 上 关系 规则 实在 是 太 严 格 了 ， 以 至 无 法 容纳 一 些 有 价值 的 思想 ， 很 多 
这 样 的 思想 第 一 次 出 现在 对 象 -关系 的 编程 语言 中 。 通 过 允许 新 的 妃 想 ， 对 象 -关系 模型 提 
供 了 许多 在 商业 方面 很 有 应 用 价值 的 扩展 性 质 。 在 本章 的 剩余 部 分 ， 如 果 没 有 特殊 指明 ， 
我 们 都 假定 关系 模型 都 遵守 所 有 的 关系 规则 。 


2.4 键 、 超 键 和 空 值 


关系 规则 3 说 明了 表 中 的 任意 两 行 数 据 在 所 有 列 上 的 值 不 可 以 都 相同 ， 也 就 是 说 两 行 不 同 
的 数据 可 以 通过 某 些 列 上 的 值 区 分 开 来 ， 或 者 以 不 同 的 视角 看 这 个 问题 ， 所 有 的 列 的 集合 将 
区 分 任意 两 行 数据 。 那 么 是 否 有 本 能 列 集合 的 子 集 也 能 区 分 出 任意 两 行 呢 ?是 的 ! 举 个 例子 ， 
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在 表 CUSTOMERS 中 ， 单 一 的 列 cia 就 可 雇 唯 一 区 分 任意 两 行 数据 (回忆 -- 下 图 2-1， 我 们 定义 
ci 为 顾客 的 标识 符 ， 任 意 行 上 的 cia 值 唯一 }。 我 们 称 cid 是 表 cUSTOMERS 的 一 个 超 键 。 意 
思 就 是 说 表 中 的 任意 两 行 数据 在 该 列 集合 上 部 有 唯一 的 值 。 州 cid 实 际 上 是 表 cUSTOMERS 的 
一 个 键 。 键 是 一 个 更 为 严格 的 事物 ， 意 思 是 组 成 键 的 列 的 集 人 台中 再 也 没有 子 集 也 是 表 的 超 键 。 

现在 一 个 很 重要 的 问题 是 :pname 是 不 是 表 PRODUCTS 的 起 键 ?即使 在 图 2-2 中 显示 表 中 的 
每 一 行 都 包含 不 同 的 pname 值 ， 而 答案 仍然 是 否定 的 ! 这 吓 因为 当 我 们 说 超 键 是 用 来 唯一 区 分 
表 中 的 任意 两 行 数 据 的 列 的 子 集 的 时 候 ， 我 们 是 从 数据 库 设 计 者 (通常 是 DBA) 的 角度 来 看 这 
个 问题 的 。 在 我 们 前 设计 当中 从 来 没有 想 过 要 把 pname 作 为 表 PRODUCTS 的 唯一 标识 。 我 们 
建 并 列 pid 作 为 行 和 的 标识 (如 图 2-1 所 示 )， 而 图 2-2 中 的 pname 恰 好 没有 重复 值 这 个 事实 仅仅 是 
个 巧合 ， 因 为 那 是 在 某 个 特定 时 刻 的 表 的 内 容 ， 可 能 在 下 个 时 劾 就 改变 了 。 比 如， 我 们 新 插 
人 -条 记录 ，pid 为 p08，pname 为 folder:; 现 在 我 们 将 有 两 行 数据 的 pname 都 为 folder， 通 过 
它们 的 pia 值 为 p06 和 p08 我 们 可 以 区 分 它们 ,虽然 这 其 行 可 能 拥有 不 同 芍 大 小 。 

我 们 也 可 以 将 大 小 也 能 人 到 名 字 里 去 (如 half-inch foldery)， 但 是 这 可 能 是 不 够 的 ， 两 个 不 
同 的 foelder 可 能 有 相同 的 大 小 、 不 同 的 颜色 或 者 不 同 的 扣子 或 者 是 由 不 同 的 材料 做 出 来 的 。 所 
有 这 些 区 别 可 以 通过 实际 表 中 的 其 他 列 ( 颜 色 ， 尺 寸 ， 材 料 等 等 ) 来 表达 出 来 。 但 是 很 容易 想象 
当 表 的 缩 构 固 定 下 来 后 ， 一 个 新 出 现 的 商品 可 能 和 其 他 的 商品 在 所 有 的 列 上 的 值 都 相同 。 为 
了 区 分 这 样 的 两 个 商品 的 行 ， 我 们 需要 一 个 piqa 到 。 开 PRODUcTS 中 生 售 单 个 唯一 区 分 行 的 列 
标识 符 是 非常 有 效 的 ; 正 是 由 于 这 个 原因 我 们 决定 定义 一 个 唯一 标识 符 piq， 然后 只 依赖 于 
pid 的 值 唯一 区 分 行 。 

表 中 新 添加 行 的 时 候 税 要 维持 表 的 键 或 者 超 键 ， 也 就 是 说 表 的 键 表达 了 数据 库 设计 者 的 
意图 ,不 管 将 来 面 对 什 么 样 的 和 情况， 并 不 仅仅 表达 在 某 一 时 刻 表 的 结构 。 接 下 来 ， 我 们 要 给 
出 几 个 定义 ， 把 键 利 超 键 的 概念 表达 得 更 详细 一 点 。 

给 定 表 T， 其 属性 用 带 下 标的 字 酸 表示 ，Head(T)=A…A,。 表 T 中 有 一 扰 组 i。 在 {A,，…: 
A 的 了 于 集 {AA,，，…，A} 上 的 定 多 元 组 ! 的 约束 ( 记 为 :[A,，…，A,j) 定 义 为 命名 的 列 上 的 ! 值 前 
kK 元 组 。 上 比如， 对 十 表 CUSTOMERS 中 的 元 组 

t=(c003, Allied, Dallas, $8.00) 

的 约束 为 由 询 cid 和 cname 组 成 的 集合 ， 记 为 {[cid,，cname]={c003，Allied)。 

利用 这 个 标记 ， 我 们 可 以 给 出 键 的 形式 化 的 定义 。 

定义 2.4.1 囊 的 键 ”给 定 一 个 表 T， 标 题 Head(1)=A…A,。 表 IT 的 - :个 键 ， 有 时 也 称 为 候选 
键 ， 是 具有 以 下 两 个 特征 的 一 组 属性 的 集合 K=Al… A 

1) 如 果 w，v 是 T 中 的 两 个 不 同 的 元 组 ， 根 据 设 计 者 的 意图 4[KI 关 v[IK]: 这 就 是 说 ， 集 合 KK 中 
必定 邦 在 至 少 一 个 列 A,,, 使 得 u[A,,] VEA,.]。 

2) 没有 天 的 真子 集 H 具 有 特征 1。 国 

条 件 1 用 数学 方式 说 明了 了 474 在 属性 集 K 1. 的 值 是 唯一 的 。 我 们 称 满足 条 件 1 而 不 满足 条 件 2 
的 属性 集 为 超 键 ， 条 件 2 保 证 了 键 是 满足 条 件 1 的 最 小 的 属性 集 ， 因 此 键 问 时 也 是 一 个 超 键 ， 
但 是 键 男 有 附加 的 特征 ， 即 它 没 有 真子 集 同时 也 是 超 键 。 满 足 条 件 1 的 单个 属性 总 是 最 小 的 ， 
因为 属性 的 空 集 yw 无 法 唯一 的 区 分 两 行 数 据 : 对 于 所 有 的 wu 和 wv， 总 有 #4[ 如 =v[W 成 立 。 

在 一 个 可 计算 机 和 化 的 数据 库 系统 中 ， 数 据 库 设 计 者 ， 通 常 是 DBA， 使 用 本 书后 面 所 讲述 
的 特定 的 语法 可 以 定义 表 中 的 键 。 一 旦 这 样 的 键 被 定 疼 ， 如 果 对 于 数据 库 的 普通 更 新 操作 ( 插 
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和 人 新 行 或 更 新 现存 的 某 行 的 列 值 ) 使 得 键 的 唯一 性 条 件 受 到 蔽 坟 ， 那 么 这 些 操作 是 不 允许 的 。 
注意 到 当 我 们 说 到 “设计 者 的 意图 ”时 ， 这 也 许 并 不 是 由 设计 者 率先 提出 。 举 个 例子 来 说 ， 
PpBA 和 再 昆 保证 socsecno 列 是 表 EMPLOYEES 的 键 ， 即 使 设计 者 已 经 建立 了 特定 的 eida 属 性 作 
为 雇员 的 标识 。 然 而 。 社 会 保障 号 当然 是 唯一 的 ， 任 何 重复 的 值 都 意味 着 表 中 的 错误 。 

表 可 能 具有 不 只 一 个 键 ， 我 们 来 看 一 下 如 下 的 例子 。 


例 2.4.1 考虑 给 定 的 表 T: 





止 如 我 们 已 经 说 明 的 ， 表 在 某 一 时 刻 的 内 和 具 无 法 告诉 我 们 表 中 的 键 是 什么 ， 因 为 键 不 表 
的 设计 者 的 意图 有 关 。 然 而 ， 为 了 说 明 我 们 瑚 要 从 给 定 的 内 容 中 计算 出 T 的 键 ， 我 们 强加 了 一 
个 很 少见 的 条 件 : 表 中 的 内 容 是 由 设计 者 设 定 ， 在 整个 数据 库存 活期 都 保持 不 变 。 有 了 这 个 
前 所 条件， 我 们 可 以 通过 确定 哪些 列 的 组 侣 可 以 使 得 行 数据 保持 唯 一 来 推导 出 T 的 键 。 

一 开始 我 们 注意 到 表 T 中 没有 任何 一 个 单独 的 属性 可 以 是 键 ， 因 为 在 每 列 上 都 至 少 有 两 个 
相同 的 值 ; 另 一 方面 ， 没 有 任何 一 个 包含 DD 的 属性 的 集合 S 可 以 是 键 ， 因 为 D 对 于 区 分 T 中 的 行 
数据 没有 任何 帮助 ,那么 3 - D 同 样 也 可 以 区 分 T 的 所 有 行 ， 所 以 S 是 T 的 一 个 超 键 ， 而 不 是 一 
个 键 。 下 一 步 考 虑 所 有 TT 中 不 包 会 D 的 属性 对 : AB，AC 和 BC。 表 T 的 所 有 有 行 在 这 些 属性 对 上 
的 值 都 保持 唯一 。 和 任何 包含 了 D 或 者 AB、AC 或 BC 作为 直子 集 的 其 他 属性 集合 都 是 超 键 (可 以 列 
出 所 有 其 他 的 集合 验证 这 一 点 )。 因 此 ，AB、AC、 和 BC 是 表 T 的 全 部 键 。 图 


关系 规则 3 保证 了 所 有 列 的 集合 可 以 唯一 区 分 任意 两 行 ， 因 此 关系 中 至 少 存 在 一 个 键 ， 其 
证 明 可 以 很 好 地 说 明 我 们 所 给 出 的 定义 是 怎么 使 用 的 。 

定理 2.4.2 每 个 表 都 至 少 有 一 个 键 。 

证 ”给 定 -个 于， 标题 Head(T)=A…Aa,， 我 们 考虑 所 有 属性 的 集合 4 ，3 必 定 是 一 个 直 
键 ， 因 为 T 中 没有 两 行 记录 ww 和 和 v 在 $. 中 的 所 有 列 上 都 具有 相间 的 值 。 对 于 任意 不 相同 的 行 x 和 v， 
在 S$, 中 在 在 一 态 性 (人 询 }A 使 得 wx[A] 关 v[A,]。 我 们 假定 已 经 知道 表 设 计 者 的 意图 ， 并 日 可 以 识别 
出 可 以 作为 表 的 超 键 的 属性 集 。 现 在 ，5, 要 么 是 键 ， 要 么 另外 存在 一 个 $, 的 子 集 8; 也 是 超 键 。 
继续 这 样 的 推导 ， 我 们 可 以 得 到 这 样 的 集合 链 : 5 ，5,，…，5，5.，…。 在 这 个 链 中 的 每 个 
集合 都 是 其 前 面 集合 的 真子 集 ， 并 且 链 上 的 所 有 集合 都 是 超 键 。 为 了 表明 有 键 存 在 ， 我 们 只 
需要 证 明 这 样 的 集合 链 最 终 会 有 个 终点 : 那么 链 尾 集合 S05 包含 在 链 上 记 有 的 S$ 集合 中 ) 设 有 有 具 
备 作 为 超 键 所 槛 求 的 属性 的 更 小 的 子 集 。 

我 们 可 以 用 如 下 的 方式 说 明 集 合 链 最 终 会 有 个 终点 。 用 铬 ,来 代表 集合 $. 中 的 属性 的 个 数 。 
5. 有 nn 个 属性 在 标题 Head(T)=A…A, 中 ， 所 以 #5, = n。 男 外 ， 我 们 有 #5,>#5,,,， 因 为 在 链 中 的 
所 有 后 继 集 合 都 是 前 一 集合 的 真子 集 。 最 后 ， 每 个 集合 中 的 属性 个 数 都 是 为 正 的 ， 因 为 一 个 
负 的 数目 是 毫 无 意 必 的 ， 而 空 集 不 可 以 是 一 个 超 键 。 因 此 上 士 面 给 出 的 集合 链 是 一 个 递减 的 序 
列 ，m=#S >##S> .> 由 >-…0。 这 样 的 序列 肯定 存在 一 个 最 小 值 ， 也 就 是 序列 中 的 最 后 
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一 个 数 阁 ,， 所 以 5 没有 可 以 作为 超 键 的 真子 集 ， 从 而 5 是 表 7T 的 键 。 这 样 我 们 就 可 以 找到 一 个 
由 不 同 整 数组 成 的 有 限 集中 的 一 个 最 小 元 素 。 但 是 一 个 数学 家 会 要 求 我 们 通过 数学 椎 导 来 证 
了 明 这 一 点 国 

本 书 中 并 不 经 常 需要 严格 的 数学 证 明 ， ， 你 应 该 明白 为 什么 为 了 证 明 & 的 存在 性 而 需 
要 这 些 证 明 。 六 就 像 当 我 们 推出 个 依 环 程序 来 计算 刍 的 局 作 集 并 且 我 们 需要 保证 循环 总 
是 会 终 正 的 ， 这 一 点 值得 注意 。 

关系 的 各 种 键 通常 被 称 为 怪 选 键 ， 这 个 定义 暗示 着 候选 键 中 的 菜 个 被 指定 为 主键 的 选 
择 过 程 。 

定义 2.4.3 ” 表 的 主键 ” 表 T 的 主键 是 被 数据 库 设计 者 选择 出 来 作为 表 T 中 特定 行 的 唯一 性 
标识 符 的 候选 键 。 国 

通常 主键 标识 符 被 用 来 作为 别 的 表 中 的 引用 。 如 图 2-5 所 示 ， 表 DEPENDENTS 和 包含 eia 玛 
指向 表 EMPLOYEES 中 的 键 列 eid。 在 CAP 数 据 库 中 ， 表 ORDERS 用 ordno 属 性 来 唯一 区 分 每 
一 行 。 一 个 扩展 的 PRODUCTS 表 可 能 除了 pid 外 另 有 其 他 的 候选 键 ， 由 表示 名 字 、 大 小 . 颜色 
以 及 零件 的 材料 等 的 列 的 集合 组 成 。 不 过 用 这 样 的 属性 集合 作为 行 的 标识 显得 和 拙 了 点 ， 所 
以 我 们 还 是 选择 了 pida 作 为 主键 。 表 2aGENTS 也 可 以 有 其 他 的 候选 键 ， 比 如 socsecnocf 社 会 
保障 号 )。 但 足 看 起 来 给 所 有 的 座 员 一 个 IDteid 或 者 ai3) 作 为 主键 使 用 起 来 更 为 方便 ， 这 正 
是 目前 大 多 数 公 司 采 用 的 ， 因 为 某 些 雇员 可 能 在 拥有 社会 保障 号 之 前 就 开始 上 班 了 。 

空 值 (NULL Value) 

慨 定 一 个 新 的 订 书 机 产品 要 加 到 PRODUCTS 表 中 ,但 是 我 们 还 没有 决定 已 经 存 到 仓库 中 
的 产品 的 quantity 或 者 仓库 所 在 的 城市 都 没有 确定 。 但 基 我 们 知道 我 们 手 涉 上 已 经 有 足 驶 
的 订 书 机 来 应 付 对 于 该 商品 的 订单 。 所 以 我 们 需要 提前 怠 开 始 这 项 业务 而 不 需 等 到 项 道 有 所 有 
的 细节 (等 到 我 们 知道 手头 上 的 库存 数目 以 后 ， 按 照 订单 送 出 贷 ， 因 此 库存 数 可 以 在 我 们 送出 
货 以 后 保持 准确 )。 为 了 记录 PRODUCTS 表 中 的 订 书 机 信息 ， 我 们 用 特殊 的 值 一 一 空 值 来 表示 
新 行 中 的 city 和 quantity 赂 性 。 








这 里 所 用 的 空 值 应 该 被 解释 为 未 知 的 或 者 是 尚 末 和 定义 的 ， 意 思 是 当 我 们 以 后 知道 更 多 情 
况 的 时 候 会 重新 填写 该 值 。 这 和 妆 一 个 字段 的 值 是 不 适用 的 时 候 用 nul 填 充 的 情况 稍 有 不 同 。 
比如 ， 如 果 我 们 在 雇员 表 中 为 公司 总 裁 填写 经 理 姓名 这 一 列 (总 裁 上 面 没 有 经 理 ) 的 时 候 ， 或 者 
是 给 一 个 没有 俩 金 的 雇员 填写 佣金 比例 的 时 候 ， 我 们 只 好 用 空 值 来 代 蔡 。 特别 值 得 注意 的 是 
空 值 和 数字 人 0 对 于 一 个 数值 属性 ) 或 者 是 空 串 〈 对 于 字符 串 属 性 ) 的 区 别 。 举 个 例子 ， 当 我 们 
要 求 计 算 手 冻 上 的 商品 的 平均 数量 的 时 候 ， 订 书 机 的 0 值 是 要 被 计算 到 平均 值 中 去 的 ， 疝 一 
空 值 意味 着 特殊 售 久 ， 在 计算 平均 数量 的 时 候 就 把 订 书 机 的 数目 从 中 噜 除 出 去 了 。 

表 的 主键 是 用 来 唯一 区 分 表 的 单独 行 的 。 我 们 现在 讨论 另外 一 条 要 求 主 键 不 能 包含 空 值 
的 关系 规则 。 比 如 ,我们 在 表 PRODUCTS 中 新 增 了 一 个 商品 名 为 stapler 的 新 元 组 ， 虽然 我 们 并 
不 知道 这 个 新 商品 的 city 和 quantity 的 属性 值 ， 这 样 我 们 就 可 以 开始 企 接 受 商 上 部 的 订单 。 
但 是 我 们 还 没有 给 它 分 配 一 个 pid 值 ， 因 为 我 们 需要 在 CRDERS 表 中 列 出 所 有 已 订购 六 而 的 
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pia 值 ， 所 以 我 们 还 不 可 以 存储 这 行 数 据 。 因 为 piq 值 是 行 的 指定 标识 符 ， 在 我 们 还 设 有 确定 
标识 符 的 值 之 前 ， 不 允许 该 行 存储 到 表 中 去 。 

主键 通常 是 特殊 的 指定 候选 键 ， 可 能 包含 多 个 列 。 我 们 在 其 上 增加 空 值 限制 来 说 明 实 体 
完整 性 规则 。 

规则 4 ”实体 完整 性 规则 表 T 中 的 任意 行 在 主键 列 的 取 值 都 不 允许 为 空 值 。 因 


我 们 将 在 后 面 的 章节 中 更 详细 地 讨论 空 值 的 性 质 。 


2.5 关系 代数 


关系 代数 由 E.F.Codd 在 一 系列 文章 中 率先 提出 ， 最 早出 现在 1970 年 ， 到 了 1972 年 基本 达 
到 当前 的 形式 。 关 系 代 数 的 目的 在 于 演示 一 个 查询 语言 从 关系 数据 库 系统 中 检索 信息 的 潜力 。 
尽管 另外 一 些 查询 诸 言 可 能 在 一 般 的 使 用 上 性 能 更 优越 。 关 系数 据 库 系统 中 用 表 的 形式 人 存 铺 
的 信息 ， 用 这 样 的 的 形式 来 显示 查询 结果 显得 很 自然 。 关 系 代数 可 以 被 看 做 是 根据 查询 结 时 
来 生成 新 表 的 方法 的 集合 ， 这 些 方法 称 为 关系 代数 运算 。 

关系 代数 是 一 -种 抽象 的 语言 ， 这 意味 着 无 法 在 一 台 实 际 的 计算 机 上 执行 用 关系 代数 形式 
化 的 查询 。 之 所 以 在 这 里 引入 关系 代数 ， 是 为 了 用 最 简单 的 形式 来 表达 所 有 关系 数据 库 查询 
语言 必须 完成 的 运算 的 集合 。 这 些 基本 的 运算 对 于 理解 第 3 章 是 非常 有 用 的 ， 在 那里 我 们 要 解 
释 在 关系 数据 库 系 统 的 标准 查询 诺言 SQL 查 询 是 如 何 被 执行 的 。 

在 本 节 的 剩余 部 分 ， 我 们 使 用 在 2.1 节 中 介绍 的 CUSTOMERS-aAGENTS-PRODUCTSICAD) 
数据 库 来 介绍 不 同 的 运算 。 我 们 给 CAP 数 据 库 增加 一 些 补充 潭 。 

关系 代数 的 基本 运算 

我 们 把 关系 代数 的 运算 分 成 两 种 类 型 :集合 论 的 运算 ， 因 为 表 实 际 上 是 行 的 集合 ; 另 一 种 
是 自然 关系 运算 ， 主 要 是 在 行 的 结构 上 。 给 定 两 个 表 R 和 S， 表 R 的 标题 Head(R)=A...A。， 在 
大 多 数 情况 下 Head(S) 与 其 相同 。 我们 定义 如 下 入 种 基本 运算 来 从 R 和 S 中 产生 新 的 表 。 下 面 给 
出 的 键盘 格式 是 用 来 在 不 包含 指定 的 特殊 符号 的 键盘 上 使 用 的 。 除 了 这 些 运算 以 外 ， 我 们 还 
要 定义 -~ 种 存放 中 间 结 果 的 方法 ， 就 好 比 在 C 语 言 或 者 Java 语 言 中 的 同 值 语句 。 


键盘 格式 示例 


UNION R ws, 或 RUNION S 
INTERSECT 有 RnmS, 或 RINTERSECTS 
-或 MINUS ”RR-5, 或 RMINUSS 
TIMES Rx5, 或 RTIMESS 


符 导 键盘 格式 示例 


R[ ] R[ | R [Ai Ai 
RwhereC RwhereC R where Ai = 5 

bq JOIN RMNS, 或 R JOINS 

二 DIVIDEBY R+5, 或 R DIVIDEBY $ 
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2.6 集合 运算 


本 节 殷 是 表 是 被 定 疼 为 行 的 集合 ,根据 关系 规则 1、 规 则 2、 规 则 3 有 : 表 中 只 有 简单 的 列 
值 ， 集 台中 没有 重复 的 行 ， 行 无 次 序 。 

击 要 掌握 的 集合 运算 有 :并 、 变 、 善 、 笛 卡 儿 积 (参见 定义 2.2.1)。 这 些 是 前 下 种 关系 代数 
运算 所 基于 的 集合 运算 。 对 于 并 、 交 、 差 运算 所 涉及 到 的 行 的 集合 要 求 具 有 相同 的 标题 结构 。 
举 个 例子 米 说 ,我 们 无 法 建立 一 个 包含 顾客 信息 表 和 商品 信息 袁 的 “并 ”组 成 的 新 表 。 因 为 
不 可 能 在 相同 的 标题 结构 下 给 所 有 的 cuUSTOMERS 表 中 的 行 以 及 PRODUCTS 表 中 的 行 一 个 合适 
的 表 结 构 ， 因 此 我 们 给 出 以 下 的 定义 。 


定义 2.6.1 兼容 表 如 果 表 R 利 S 具 有 相同 的 标题 ， 也 就 是 说 ， 如 果 Head(R)=Head(S) 而 出 
属性 是 从 相同 的 域 中 选择 并 具有 相同 的 含义 ， 则 表 R 和 S 是 兼容 的 国 

1. 并 、 交 和 差 运 算 

羽 当 两 个 表 蚌 兼容 表 的 时 候 才 可 以 做 并 、 交 、 差 运算 。 

定义 2.6.2 并 、 交 、 差 R 和 S 是 两 个 兼容 表 ，Head(R)=Head(5)=A…A,。R 和 S 的 并 是 RR 
US 所 得 的 表 ， 有 长 有 同样 的 标题 ， 由 属于 R 或 者 属于 3 或 者 属于 两 者 的 所 有 行 组 成 ; R 和 8&S 的 交 
是 RNs 的 表 ， 由 既 属 于 RR 又 属于 $8 的 行 组 成 。R 和 S 的 差 是 R - S 的 表 ， 由 属于 R 而 林 属 于 S 的 行 
组 成 。 图 

注意 ，RUS=SUR， Rms=SmR， 但 是 R - $ 一 般 来 说 和 S -RR 不 同 。 所 有 的 关系 运算 是 可 
以 递归 的 ， 所 以 定义 2.6.2 中 的 表 R 和 S 也 可 以 是 其 他 关系 代数 表达 式 的 结 困 。 我 们 可 以 在 这 些 表 
达 式 外 和 面 加 上 圆 括 号 而 不 改变 所 有 表达 式 的 含 头 。 比 如 ， 我 们 可 以 用 (R - S) 来 代替 R - S$。 这 对 
于 启明 计算 次 序 是 非常 有 用 的 。 在 一 般 的 数学 表达 式 中 ， 赦 在 圆 括号 内 的 子 表达 式 先 被 计算 ， 
因此 对 于 表达 式 R - (S - R) 意 味 着 我 们 首先 计算 S - R， 得 到 结果 为 T， 然 后 计算 R - T 得 到 最 终 
结果 。 

例 2.6.1 考虑 表 R 和 8; 
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注意 到 在 R 和 S 中 同时 出 现 的 只 有 现行 ， 所 以 RD 六 3 有 两 行 记 录 : 





例 2.6.2 变 . 并 、 差 运算 通常 可 以 用 文 氏 图 (Venn Diagranuy 来 示意 ， 如 下 所 示 : 





这 种 说 明 的 格式 有 时 也 作为 里 些 等 价 原理 的 演示 ， 稍 后 可 以 看 到 。 插 

2. 赋值 和 别名 

在 关系 代数 表达 式 计 算 过 程 当中 ， 有 了 时候 存 储 中 间 结 果 是 很 有 用 的 。 我们 接 下 来 要 介绍 
一 种 符号 使 得 关系 代数 具有 该 功能 。 

定 尽 2.6.3 ”峰值 、 别 各 R 是 一 个 表 ，Head(R)=A…A,。 假 定 B,，…，B, 是 n 个 属性。 对 
十 所 有 的 1 竺 i 筷 #， 它 们 的 城 Domain(B,)=Domain(A,)。 通 过 赋值 

StB,, ns B,) : =R(A,, "sy 和 贞 .) 

我 们 定 六 一 个 新 表 $8， 且 HeadfS)= 了 …B,。 新 表 S$ 的 内 容 恰 好 和 有 旧 表 R 的 内 容 相 同 ， 也 厌 是 
说 行 # 在 $ 中 当 妾 仅 当 在 R 中 存在 一 个 行 +， 对 于 所 有 的 1 反 i 委 m 有 zx[B,]=tlA] 成 立 。 在 赋值 中 使 
用 的 符号 : = 称 为 赋值 运 莽 竺 . 

我 们 已 经 努力 使 得 赋值 运算 允许 对 源 表 的 标题 里 的 属性 名 进行 重 定 又 ， 我 们 不 入 了 怠 可 以 
体会 到 这 一 点 的 价值 。 现 在 我 们 需要 指明 ， 属 性 的 重 定 交 并 不 总 是 必要 .如 果 两 个 表 中 所 有 的 
履 性 名 都 是 一 对 一 的 ， 并 且 对 于 所 有 的 1 所 i 所 n 都 有 B.= 入 成立， 我 们 可 以 简单 地 称 S 为 表 R 的 
别名 ， 简 写 为 8:=R。 加 

注意 到 在 公式 右边 的 表 R 也 可 以 是 关系 代数 的 表达 式 求 值 ， 因 此 ， 只 此 我 们 在 编程 语言 中 
使 用 赋值 。 这 就 允许 拒 们 把 表 法 式 计算 的 中 间 结 果 “ 保 存 ” 下 来 。 存 公式 左边 的 表 $ 必 须 是 一 
个 命名 的 表 ， 它 不 可 以 是 一 个 表达 式 。 
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例 2.6.3 考虑 例 2.6.1 给 出 的 两 个 表 R 和 S$。 使 用 赋值 运算 我 们 定义 一 个 新 表 : 
T:=(RUS)- (RNS) 
表 T 具 有 如 下 的 形式 : 





我 们 也 可 以 通过 先 定 义 两 个 中 间 表 来 定义 表 T: 


T1;= {RB 8} 
72:= IRm 8S) 
T:=T1-T2 用 


例 2.6.3 中 的 两 个 中 间 表 T1 和 T2 不 是 必需 的 ， 因 为 关系 代数 表达 式 人 允许 任意 厂 套 。 如 果 我 
们 给 定 的 表达 式 exprl 中 包含 了 T1， 而 T1 又 通过 赋值 由 包含 其 他 表 的 表达 式 expr2 表 示 ， 那 么 
我 们 可 以 用 exprt2 取 代 exprl 中 出 现 的 所 有 T1 而 得 到 相同 的 结果 。 赋 值 运算 的 最 主要 目的 是 为 
了 使 接 下 来 的 章节 中 演示 复杂 表达 式 的 中 间 结 果 的 计算 更 容易 理解 。 

3. 乘积 运 莫 

乘积 运算 是 基于 集合 运算 中 的 笛 卡 儿 积 的 。 角 定 R 和 $ 是 两 个 帮 ， 并 且 Head(R)=A 和 AAA 
Fead(S)=B…B,。 有 R 和 S$ 的 乘积 可 以 允许 我 们 建立 一 个 包含 两 个 表 中 行 之 问 所 有 可 能 的 相互 联系 
的 新 表 。+ 是 R 中 的 元 组 ， 值 为 (r(A)，…，KAW))。s 是 $ 中 的 元 组 ， 值 为 (s(B1)，…，s(B,))， 备 卡 
中 积 的 定义 说 明 尺 和 $ 的 绪 积 包含 了 所 有 的 R 和 S$ 的 元 组 对 ， 形 如 (Or(CAD)，…，ntAD))，({s(B)，…， 
s(B,))。 表 RR 和 和 表 $ 的 列 的 差别 一 一 它们 的 值 分 别 落 到 了 在 笛 卡 皮 积 中 的 一 个 元 组 的 不 同 列 上 一 一 
和 我 们 的 关系 表 的 定义 (要求 不 区 分 列 ) 是 相 违 背 的 ， 因 此 我 们 需要 个 更 面向 关系 的 定义 。 


定义 2.6.4 ” 季 积 ” 表 R 和 S$ 的 葬 积 是 标题 Head(T)=R.A…RR.A, S.B.…S.B, 的 表 T.， 我 们 称 t 
是 TT 中 的 行当 且 仅 当 存 在 R 上 的 一 个 行 xw，S 上 的 一 个 行 v， 而 1 是 u 和 + 串 接 ， 即 wiv。 我 们 称 t 是 T 
上 的 行当 生 仅 当 存在 RE 上 的 行 x"，S 上 的 行 x 并 且 对 所 有 的 1 志 i 筷 nn， 有 (R.A)=a(AD) 威 立 ， 对 及 
有 的 1 志 j 万 m， 有 (S.B)=v(B) 成 立 。R 和 8 的 积 T 用 R x S 表 示 。 国 

我 们 用 到 .A 的 形式 来 表示 一 个 属 人 性 的 名 字 ( 丈 是 相 乘 表 中 的 表 名 ). 并 称 之 为 恨 定 属性 名 ， 
或 限定 属性 。 乘 积 表 的 标题 由 限定 属性 组 成 ， 并 且 当 我 们 需要 重点 指出 属性 是 从 哪个 表 中 取 
出 来 的 时 ， 可 以 用 这 些 上 限定 属性， 因为 在 多 个 乘积 表 中 同时 出 现 相 同 的 列 名 ， 有 可 能 造成 混 
乱 。 如 果 属 性 名 员 出 现在 一 个 表 中 ， 我 们 可 以 直接 用 它 的 非 限定 属性 ， 


例 2.6.4 考虑 表 R 和 8 以 及 它们 的 积 如 下 所 示 : 
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RxS 


is] [ss [sel 


BEERESCNENEN 
a be bl lo | 
ai da 
| 本 ic 
at |b2 le3 |bl |c2 |d4 | 
pc [ol det fdr 
po 

在 表 R x Ss 中 ,属性 A 和 DD 都 是 唯一 的 ， 因 此 可 以 不 用 限定 就 可 以 引用 ; 而 属性 R.B 和 
3 .B 就 必须 要 加 上 限定 符 名 {简称 限定 符 )R 和 ss 才能 区 分 开 来 ， 在 上 表 的 表 R x 3 中 ， 所 有 列 
名 都 是 限定 的 。 图 

这 个 重子 说 明 我 们 可 以 在 出 莱 积 运算 来 由 相对 较 小 的 表 构 造 太 表 ， 举 个 例子 ， 对 于 商 个 
具有 1000 行 的 表 的 积 可 以 有 100 万 行 。 

当 我 们 试图 计算 表 它 与 其 本 身 的 匀 积 的 时 候 ， 即 考虑 R x R 这 种 情况 ， 那 么 定义 2.6.4 暗 示 
我 们 限定 符 名 会 存在 问题 。 因 为 Rx RR 具有 标题 R.A.…-R.A, R.A…R.A,， 根 据 这 些 名 字 无 法 分 
准 出 单一 属性 是 属于 哪 一 部 分 ， 因 此 和 屠 积 R x R 是 不 被 允许 的 。 这 种 情况 可 以 通过 表 R 的 别名 
来 避免 ,使 用 峰值 $ : =R， 然 后 计算 及 和 它 的 别 各 5 的 飞 积 : R x 5。 


2.7 自然 关系 运算 


我 们 定 尽 了 四 个 自然 运算 用 来 处 理 表 的 关系 结构 。 它 们 是 投影 、 选 择 、 连 接 和 相 除 。 像 
定义 乘积 运算 一 样 ， 我 们 处 理 表 R 和 8$， 其 标题 分 别 为 Head(R)=A,…A. 和 Head(S)=B…B。 

1. 投影 运算 

投影 运算 作用 在 一 个 表 上 上 ， 删 除了 表 上 的 某 些 列 ， 包括 标 题 以 及 表 肉 容 上 对 应 的 列 上 的 
值 。 我 们 说 把 表 投 影 到 没有 被 删除 的 列 的 集合 上 。 注 意 到 表 R 上 不 同 的 行 在 投影 到 列 的 子 集 上 
后 可 能 会 相同 ， 因 为 用 于 区 别 两 个 值 的 列 已 经 被 删除 掉 了 。 当 发 生 这 和 神情 况 的 时 候 ， 投 影 运 
算 符 向 样 删除 重复 的 行 ， 只 在 结果 集中 留 下 重复 行 的 一 个 措 凡 。 下 面 是 一 个 更 为 严格 的 定义 。 













定义 2.7.1 投影 R 在 属性 A,，…，Ax{fA,，…，Ad ETA，…，Aj) 上 的 投影 是 标题 
为 HeadfT)=AAu 的 表 T， 包 含 如 下 内 容 。 对 于 所 有 的 R 上 的 行 ， 在 T 上 也 存在 一 个 唯一 的 
行 上 对 于 所 有 的 ALefA,，…，A 有 FTA]=I[A,] 成 立 。R 在 A,，…，Ak 上 的 投影 用 R[A，， 
As 表示 。 图 


投影 运算 把 表 中 浅 有 在 方 括 导 中 的 属性 列表 中 命名 的 列 给 请 除 掉 了 。 
例 2.7.1 “很 设 我 们 需要 把 图 ?2-2 中 表 CcUSTOMERS 的 顾客 各 全 部 打印 出 来 ， 但 是 不 需要 包 
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伟 他 们 的 标识 符号 码 、 城 市 和 折扣 是， 这 可 以 在 关系 代数 中 实现 ， 遂 过 写 
CH := CUSTOMNERSLEname 
车 果 表 CN 是 表 CUSTOMERS 中 烈 cname 上 的 内 容 。 







CH 


注意 到 图 2-2 中 显示 两 个 重复 的 ACME 值 经 过 投影 后 变 成 了 单一 的 行 。 国 

这 是 我 们 第 一 次 用 关系 代数 表达 式 来 回答 用 自然 诺言 表达 的 对 数据 的 查询 要 求 ， 我 们 称 
这 样 的 表达 式 为 关系 代数 查询 ， 简 称 为 查询 。 

下 一 个 要 定义 的 是 选择 运算 ， 从 给 定 的 表 中 选择 出 满足 特定 准则 的 行 来 构成 新 的 表 。 指 
定 这 些 准 则 的 条 忻 的 具体 形式 由 下 面 给 出 的 定义 来 表达 。 

定义 2.7.2 选择 给 定 一 个 表 S$，Head(S)=A…A,， 选 择 运 算 定义 …- 个 新 表 ， 用 

3 where 交 
表示 ， 具 有 相同 的 属性 集合 ， 包 含 了 S$S 中 满足 选择 条 忻 ( 简 称 条 件 ， 记 为 C) 的 元 组 。 根 据 是 硅 
满足 条 件 来 决定 对 于 每 个 给 定 的 表 的 元 组 是 否 应 该 被 选择 出 来 保留 在 行 集 全 中。 条 件 和 的 形式 
可 以 通过 如 于 的 递归 和 定义 表示 : 

1) C 可 以 是 任何 形 如 A,x A 或 者 A,%a 的 比较 ,这 里 A 和 A 都 是 S 中 具有 相同 域 的 属性 ，a 是 
Domain(AA) 中 的 一 个 常数 ，c 是 比较 符 导 ,可 以 是 <，>，=，<=，>= 和 <>( 比 较 符 心 在 岗 个 被 
比较 值 不 等 时 为 真 ) 等 。 表 S where Ac A, 包含 所 有 满足 条 忻 1[A,] tf[A] 的 行 1。 而 表 S where 
A,eca 包 含 所 有 满足 条 件 !A,] < a 的 行 。 

用 图 2-2 中 的 CUSTOMERS 表 举例 ， 条 件 可 以 写 为 city='Dallas' 和 discnt>=8g.00。 注 意 到 
条 件 中 的 字符 常 其 是 放 在 引号 中 间 的 。 在 CUSTOMERS 表 中 没有 属性 对 具有 相同 的 值 ， 代 是 对 
于 比如 city>cname 这 样 的 一 个 条 件 ， 这 里 操作 符 “>” 要 求 第 一 个 操作 数 中 的 字符 常量 在 字 
人 十 表 中 的 位 置 位 于 第 二 个 操作 数 之 后 。 

2) CC 和 C' 都 是 条 件 ， 那么 新 的 条 件 可 以 是 C AND C' ，C OR C' 或 者 四 NOT C， 可 能 需要 
把 新 生成 的 条 件 放 入 加 括号 中 去 。 如 果 呆 : =5 where CC，V ;=5 where C, 那 委 我 们 右 : 

“。 AND 连接 符 :$ where C, and C, 意思 如 同 UN VY。 

sOR 连 接 符 :S where C, or C, 意思 如 同 UUY。 

“ NOT 连接 符 :S where notC 意思 如 同 $ - U。 

表 “S where C” 包 含 了 S$ 中 所 有 满足 条 件 C 的 行 。 条 件 的 计算 是 通过 检查 定义 2.7.2 中 的 第 
一 部 分 的 子 表达 式 的 比较 ， 然 后 下 检查 复 杂 的 逻辑 语 名 是 否 正确 。 是 


例 2.7.2 为 了 找到 所 有 在 Kyote 的 顾客 ， 我 们 需 划 如 下 的 选择 : 


CUSTOMERS where city = Kyoto' 


这 个 查询 的 结果 根据 图 2-2 如 下 表 : 
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ee [roe [cre [aren 
Er 

为 外 一 个 例子 ， 人 假设 我 们 需要 找到 所 有 存放 在 Dallas 的 价格 超过 $0.50 的 商品 ， 我 们 可 以 
用 如 下 的 选择 : 


PRODUCTS where eity = Dallas’ and price >» 0.50 


该 查询 的 结果 如 下 表 : 
















re 


po | (oier | Duras | 123700 [2.00 | 


目前 所 提 到 的 运算 结合 起 来 可 以 解决 更 为 复杂 的 查询 。 

例 2.7.3 ”很 容易 我 们 就 可 以 写 出 一 个 关系 代数 表达 式 来 检索 所 有 佣金 比例 超过 6 多 的 代理 
商 。 我 们 使 用 选择 运算 并 定义 表 L: 

L ;= AGENTS Where percent >™ 6 


这 个 查询 所 得 的 结果 表 如 图 2-6。 


HN :一 AGENTS where percent >= 在 


CT Te Te 
Te 
a | one ewan | 6 
a ow Nevor | 6 


图 2-6 LL:-=AGENTS where percent»=6 


现在 假设 我 们 需要 检索 所 有 的 代理 对 ,它们 都 具有 超过 6 免 的 佣金 比例 ， 并 且 都 在 同一 个 
城市 。 我 们 通过 使 用 乘积 运算 符 可 以 做 到 。 但 是 我 们 需要 小 心 ， 不 要 使 用 L x L， 原 因 我 们 已 
经 在 2.6 六 解释 过 了 ， 所 以 我 们 从 另外 的 一 个 别名 定义 开始 。 

现在 我 们 可 以 给 出 解决 问题 的 表达 式 ， 

PAIRS := {LL x MH} where L.city = MN.city 

有 了 表 M， 它 和 L 的 区 别 仅 仅 在 于 具有 不 同 的 名 字 ， 我 们 就 可 以 在 乘积 L x M 上 定义 一 个 

条 件 ， 来 检索 满足 具有 相同 城市 的 记录 。 基 于 图 2-2 的 PAIRS 表 达 式 的 结果 如 下 : 
























PAIRS 
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这 个 表 和 包含 了 大 量 的 元 余 售 息 。 实 际 寺 仅 一 个 aid 对 (a01，a04) 就 可 以 满足 我 们 所 要 求 的 ， 

但 是 PAIRS 的 关系 代数 表达 式 同 时 把 道 序 的 aijd 对 {a04, a01 以 及 相同 的 代理 对 比如 fa01, a01)， 

也 表示 出 来 所 以 需要 建交 一 个 更 为 严格 的 选 拌 条件 使 得 一 次 就 可 以 取出 唯一 的 代理 组 人 洁 来 。 
PAIRS2 := CL NX HY where Lcity = Heity and Laidg < M.aid 


这 个 表达 式 的 结 采 如 下 : 


PAIRS2 





例 2.7.4 我们 注意 到 在 最 后 的 答案 中 ,全 2.7.3 中 的 PAIRS2， 只 有 一 行 。 骨 看 看 图 2-2 我 
们 就 知道 这 是 为 什么 了 : 只 有 两 个 代理 商 是 在 同一 个 城市 的 ， 这 个 城市 是 New York。 现 在 我 
们 来 回答 下 面 这 个 问题 ， 我 们 是 不 是 可 议 用 一 个 稍 有 不 同 的 浊 鹿 FAIRS3、 直 接 指 定 城 市 为 
New York 而 不 指定 同一 个 城市 来 取代 查询 PaAIRS2 呢 ? 也 就 是 说 我 们 用 


PAIRSZ sm CL X MY) where Lcity 一 村 ,人 1ty and L.aid < HW,aid 


来 代替 

PRATRS3 ;一 (LS MY Where Lcity = ‘New York' and 村 ,ity = New York and L.aid < M.aildy 
如 果 不 可 以 ， 为 什么 呢 ? 虽然 这 两 个 查询 给 出 了 相间 的 结果 。 这 个 问题 说 明了 前 面 所 提 到 的 
一 个 常 犯 的 错误 ， 所 以 需要 在 这 里 特别 指出 。 实 际 上 ， 皂 使 它们 似乎 给 出 了 相同 的 管 案 ， 两 
个 查询 是 完全 不 同 的 。 这 两 个 查询 的 结果 仅 在 某 一 时 刘 的 素 的 内 容 上 是 相同 的 。 回 想 我 们 在 
图 2-2 中 特 器 强调 这 些 表 的 内 容 会 经 常 发 生变 化 ， 我 们 的 查询 应 该 在 不 孝道 表 内 容 的 情况 下 纵 
出 正确 的 结果 。 如 果 我 们 突然 决定 在 图 2-2 中 的 表 AGENTS 加 入 一 -个 新 的 代理 商 元 组 (a07， 
Green，Newark，7) ， 那 公 我 们 的 PAIRS52 的 结果 舟 会 有 变化 ， 因 为 现在 有 有 男 外 一 对 代理 南 
(a02，a07) 也 具有 至 少 6 免 的 个 金 比 例 ， 且 在 河 一 个 城市 (Newark}。 这 正 是 我 们 所 要 求 查 询 的 ， 
这 个 查询 具有 自 适应 能 力 。 然 而 ，PAIRS3 的 结果 不 会 改变 ， 因 为 我 们 错误 地 用 了 一 个 依 束 
AGENTS 表 内 容 的 条 件 (L .city-='New York'and M,city='New York' 代替 了 所 希望 表 
达 的 条 件 ( 人 .city=M.cit。 在 建立 我 们 自己 的 关系 代数 查询 表达 式 的 时 候 ， 要 小 心地 避免 
这 样 的 错误 ， 我 们 称 之 为 内 容 依赖 。 对 于 某 个 特定 时 刻 表 的 内 容 ， 两 个 查询 绪 洒 相同 还 不 足 
以 保证 这 两 个 查询 表达 式 是 等 价 的 ; 它们 必须 要 求 对 于 所 有 可 能 的 表 的 内 容 的 都 给 出 相同 的 
结果 。 是 

3. 关系 代数 优先 级 

例 2.7.4 中 定义 的 表达 式 PaIRS2 和 PaIRS3，L 和 和 M 的 弱 积 是 在 where 子 句 前 包含 在 两 个 图 
括号 内 的 ， 这 是 因为 表达 式 (L x M) where 已 是 先 做 稍 卡 几 积 ， 然 后 下 执行 where 子 句 所 表达 的 
选择 运算 ; 而 表达 式 L x M where C 代 表 的 先 建立 选择 M where C 然 后 与 L 做 香 卡 几 积 运算 ， 因 
此 LxM where C 和 Lx(M where C) 具 有 相同 的 合 闵 。 实 际 上 ， 如 果 我 们 用 第 二 种 方式 的 话 
PAIRS2 是 不 确定 的 ， 因 为 Lx(M where L.city=M.city and L.cid<M.cid}) 中 有 个 where 
子 句 指向 一 个 不 在 表 M 中 的 列 ， 但 它 却 是 选 树 的 对 象 之 一 。 

Lx M where C 和 EL x (M where 具有 相生 含义 ， 这 是 因为 关系 代数 运算 具有 缺 省 的 优先 
级 。 战 者 说 是 比 定 强度 ,决定 了 在 一 个 没有 图 括号 的 表达 式 中 哪 一 个 运算 最 先 被 执行 。 表达 
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一 一 一 一 一 


式 中 的 圆 括号 覆盖 了 缺 省 的 优先 级 关系 ， 因 此 在 圆 括 号 中 的 子 表达 式 总 是 先 被 计算 。 在 普通 
{数值 ) 代 数 中 的 一 个 例子 是 表达 式 5 x 3+4， 很 容易 就 可 以 计算 出 这 个 表达 式 的 值 为 19。 因 为 
我 们 直觉 地 辨认 出 乘 号 (x) 上 共有 比 加 号 (+) 更 高 的 优先 级 ， 写 成 5 x 3+4 相 写成 (5 x 3)+4 是 一 样 
的 ,但 是 我 们 可 以 用 圆 括号 来 覆盖 掉 原 来 的 优先 级 关系 : 5 x 3+4=19 而 3 x (3+4)=35。 同 样 的 
道理 ， 关 系 代 数 运 算 也 具有 自己 的 优先 级 关系 ， 现 在 我 们 已 经 介绍 了 大 多数 的 运算 ， 谁 备 把 
它们 结合 起 来 构成 更 复杂 的 表达 式 。 在 此 之 前 我 们 需要 把 优先 级 的 概念 表达 清楚 ， 

定 尽 2.7.3 ”关系 运算 的 优先 级 ”关系 运算 符 的 优先 关系 在 图 2-7 中 给 出 ， 这 个 表格 包括 了 
关系 运算 连接 和 各 除 ， 我 们 稍 后 介绍 加 


符号 
RI ] 
R where C 


[四 ， 二 





图 2-7 关系 运算 优先 级 


例 2.7.5 假设， 我 们 需要 找 出 满足 条 侍 的 城市 ， 这 个 城市 要 求 有 顾客 折扣 率 低 十 10 允 或 
者 有 一 家 避 金 百分率 不 低 于 6 免 的 代理 商 。 这 个 查询 可 以 用 以 下 的 关系 代数 表达 式 表 示 : 

[CUSTOMERS where digcnt <10)} [city] UrirAGENTS where percenr cb LSILY] 

注意 到 并 操作 在 此 处 是 必需 的 。 我 们 无 法 用 定义 2.7.2 中 的 选择 条 件 中 的 OR 连接 符 来 取代 。 
因为 结果 中 的 城市 是 从 完全 不 同 的 表 中 得 出 ， 涡 要 有 不 同 的 检索 条 件 才 能 构成 最 终结 来 。 四 

4. 连接 运算 

连接 运算 的 目的 在 于 ， 遂 过 某 个 特定 同名 列 上 的 等 值 美 系 把 两 个 给 定 的 表 关联 起 来 ， 构 
成 新 表 。 上 比如， 我们 连接 表 oRDERS 和 cuUSTOMERS， 它 们 具有 共同 的 cia 列 ,结果 表 将 包含 
ORDERS 家 中 的 订单 内 容 以 及 从 CUSTOMERS 表 中 取出 该 订单 的 顾客 的 辅助 信息 。 这 里 所定 义 
的 连接 运算 也 称 为 等 值 连 接 或 者 自然 连接 。 

定义 2.7.4 连接 考虑 表 R 和 8$， 其 标题 分 别 为 : Head(R)=A 和, B.'…B, 科 Head{S)=B,… 
BC…C_。 这 里 z, 大 ， 玉 分 别 是 属性 类 A，B，C 的 数目 。 我 们 定义 也 …B, 是 两 个 表 共 健 的 完全 
属性 子 集 ， 该 子 集 在 k=0 时 可 能 为 空 。 同 样 A…'a, 是 及 中 不 在 $ 里 的 属性 ，C CC 是 $ 中 不 在 良 
里 的 属性 ， 这 两 个 集合 也 同样 可 以 是 空 ， 此 时 n=0 或 者 m=0。 表 RR 和 Ss 的 连接 是 新 表 R mS， 标 
题 Head(R mS)=A…A,B.…B,C.…C,o 行 在 表 R MS 中 ， 当 且 仅 当 存 在 商 个 行 4 属于 R, v 属 十 5， 
对 于 所 有 的 1 志 i 志 有 wu[B,J=Y[B,] 成 立 。T 中 的 属性 列 上 的 值 为 : 对 于 所 有 1 所 i 志 n 有 1![Aj=zfA] 
成 立 ， 对 于 所 有 1 所 i 所 上 有 1[B,]=w[B,]=v[BJ] 成 立 ， 对 于 所 有 1 所 i 所 mm 有 下 CJ]=vLC.] 成 立 。 如 果 RR 
中 的 4 行 和 S$ 中 的 y 行 构成 了 T 中 的 行 :， 我 们 称 这 两 行 是 可 连接 的 。 局 


我 们 称 B,…B, 是 表 R 和 表 S 连 接 的 属性 。 关 系 规则 之 一 (我 们 仅 在 前 面 的 关系 规则 2 中 担 到 ) 
说 明 表 中 的 列 的 次 序 是 无 关 紧 竖 的 。 特 别 地 ， 并 不 需要 B,…'B, 正 好 按 次 序 出 现在 表 R 的 未 尾 表 
S 的 开头 ， 它 们 其 实 可 以 出 现在 两 个 琢 中 的 任何 在 置 。 
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例 2.7.6 考虑 如 下 的 两 个 表 R 和 5: 





我 们 可 以 看 到 表 R 中 的 第 二 行 和 $ 中 的 性 何 行 在 列 B, 和 3: 上 都 不 同时 匹配 ， 所 以 它 无 法 在 
R MS 中 构成 新 行 。 嚼 一 方面 ， 表 R 中 的 第 一 行 可 以 和 8 中 的 两 个 记录 做 连接 ， 因 此 ， 它 在 表 
R MS 中 可 以 生成 两 行 。 表 R 中 的 第 三 行 同 样 可 以 和 天 S 中 的 一 行 做 连接 。 我 们 也 注意 到 了 表 5S 
中 的 第 四 行 没有 和 表 有 中 的 任何 行 是 可 做 连接 的 。 因 此 在 及 中 SS 中 设 有 构成 新 的 记录 。 新 表 
R mS 如 下 : 


bl mo 
EENEN 





El 
mleles 


如 果 表 R 和 8 没有 共同 的 属性 做 连接 运算 ， 那 么 连接 的 结果 和 两 个 表 做 笛 卡 上 儿 积 操作 的 结 
果 和 相同 ， 这 也 就 是 说 ， 如 果 B…B, 为 空 ， 即 上 0， 那 么 RS=RxS;i 另 一 方面 ， 如 果 R 和 S 有 具 
有 相同 的 属性 集 ， 那 么 两 个 表 的 连接 运算 和 两 个 表 的 交集 相同 ， 这 就 是 说 ， 如 果 AA…A 和 CC， 
者 为 空 集 ， 即 m= 记 =0， 那 么 RS=RPS。 两 者 的 等 价 关 系 在 本 章 后 面 的 习题 可 以 验证 ， 
但 是 你 可 以 对 它们 提出 有 助 于 理解 连接 定义 的 某 种 见解 。 

我 们 更 在 来 考虑 CAP 数 据 库 中 的 一 些 例子 . 


例 2.7.7 我 们 要 求 找 出 所 有 订购 商品 p01 的 顾客 的 名 字 。 要 明日 我 们 入 要 两 个 表 中 的 信息 
才能 回答 这 个 问题 ， 因 为 订单 信息 是 存放 在 表 ORDERS 中 ， 而 表 ORDERS 中 并 不 包含 顾客 的 名 
字 ， 为 了 得 到 这 个 值 (cname) 我 们 需要 查询 表 CUSTOMERS。 在 关系 代数 中 完成 这 一 查询 的 一 
个 很 自然 的 方法 是 在 表 cRDERS 和 表 CcUSTOMERS 上 进行 连接 ， 因 此 ， 我 们 上 先 来 看 看 这 个 连接 
的 结果 。 如 果 定 义 CUSTORDS :=CUSTONER 四 ORDERS， 对 应 于 图 2-2 的 内 容 。 图 2-8 显 示 了 连 
接 的 结果 。 

表 cCUSsTOMERS 和 表 CRDERS 的 唯一 的 共同 属性 是 cia， 而 cia 列 是 表 CUSTOMERS 的 键 、 
也 就 是 说 cida 的 值 在 所 有 的 行 上 是 唯一 的 。 同 时 ， 表 ORDERS 中 每 一 行 数据 上 也 有 - -个 特殊 的 
cid 值 列 出 了 订购 商品 证 单 的 顾客 (两 个 不 同行 具有 相同 的 cid 值 当然 是 允许 的 )。 连 接 两 个 表 
的 作用 在 于 扩展 表 ORDERS 中 的 每 一 条 记录 ， 使 得 它们 包含 了 表 CUSTOMERS 中 的 对 应 的 cid 
的 所 在 的 行 信息 。 连 接 运 算 显然 是 一 个 重要 的 操作 ， 因 为 我 们 需要 把 表 CRDERS 中 的 有 关 ciq 
信息 和 表 CUusTOMERS 中 的 对 应 的 cig 信 息 相 连 直 来。 我 们 也 可 以 在 pia 和 aia 中 做 同样 的 事 
情 . 通 过 把 琢 DRDERS 和 表 PRCODUCTS 或 琢 aAGENTS 做 连接 运算 ， 可 以 扩展 表 ORDERS 中 记录 的 
对 应 的 商品 或 者 代理 商 信 息 。 
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CUSTORDS 


me ety | rom [eros [orn [er ve ma | vey | eonere | 
| TipTop | puluth | 10.00 | 1011 | jian | coo0t | a01 pot | 1000 | 450.00 | 
Duluth feb co001 | a02 | pO2 | 400 | 180.00 | 
pur | 000 | ore | eo | cor | a03 for | eo0 | e000 
Duluth 305 
54000 | 
880.00 | 
70400 





























Du | 1000 [1077 | eo | eoor | s06 | p03 | eo0 
要 EI 
3 


Alied | Dailas | 8.00 | i015 | jan | e003 | a03 | p05 1104.00 
po | soo | roa1 | ep | co0r | o06 | p07 | 1000 | se01 
Kyoto S00.00 
Kyoto 


Kyoro 





图 2-8 CUSTORDS : -CUSTOMERS MM ORDERS 


对 于 要 求 找 出 所 有 订购 商品 p01 的 顾客 的 和 名字 这 个 问题 的 解决 方法 用 关系 代数 查询 表 
达 如 下 ， 

CHPOL := CEUSTOMERS Pd ORDERS where pid = "p01l'}) [cname] 

注意 ， 根 据 关 系 代数 的 优先 规则 ， 在 ORDERS where pid='p01' 两 边 隐 含 了 一 个 圆 括 号 ， 
这 个 表达 式 给 出 表 ORDERS 中 与 p91 产品 相关 的 行 ， 然 后 与 表 CUSTOMERS 做 连接 运算 扩展 表 
ORDERS 中 包含 p01 商 品 的 记录 ， 最 后 在 cname 上 的 投影 使 得 只 有 cname 列 出 现在 结果 中 ， 最 
终结 果 CNP01 如 下 : 


CNPO1 





例 2.7.8 ”现在 我 们 想 要 查询 所 有 订购 了 至 少 一 种 价值 为 80.50 的 商品 的 顾客 名 宁 。 我 们 首 
先 列 出 : 


CHEAPS := {PRODUCTS where price = 0.50) [pid] 


这 个 表达 式 取 出 了 所 有 价值 为 $0.50 的 商品 的 pia， 然 后 我 们 计算 


{ORDERS Ce] CHEAPSY by CUSTOMERSY [emame] 


从 (ORDERS CHEAPS) 中 得 出 了 包含 价值 $0.50 的 商品 的 订单 ， 然 后 把 这 些 中 间 结 果 的 


-CO Tr - 
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订单 信息 和 表 CUsTCOMERS 做 连接 运算 可 以 找到 顾客 的 名 字 。 我 们 也 可 以 通过 把 上 面 两 步 合并 
来 避免 赋值 语句 : 

(ORDERS PA 【PRODUCTS where price = 0O.50) [Lpidj; baq CUSTOMERS} [cname} 

很 重要 的 一 点 是 在 我 们 建立 CHERAPS 表 的 时 候 我 们 必须 把 价值 $0.50 的 商品 信息 投影 到 
piBE, 表达 式 

{ORDERS bs PRODUCTS where price = 0.50) bd CUSTOMERS) Lcname] 

可 能 无 法 正确 解决 这 个 问题 ， 因 为 在 第 二 次 连接 操作 中 有 一 些 无 法 预计 的 额外 列 对 于 两 
个 表 来 说 是 共有 的 ， 这 个 表达 式 要 求 商品 的 city 和 订购 该 商品 的 顾客 所 在 的 city 也 必须 相 
同 。 这 个 练习 之 一 就 是 要 求 你 显示 出 后 面 这 个 查询 的 结果 ， 并 获得 原先 正确 的 关系 代数 表达 
式 查询 的 结果 ,这 个 比较 的 意 愉 在 于 告诉 我 们 ， 在 屋 连 接 的 时 候 必 须 使 用 投影 来 避免 一 些 连 
接 上 的 不 确定 影响 。 加 

乘积 和 连接 运算 都 满足 结合 率 。 也 就 是 说 ， 如 果 R，S$，T 是 -个 表 ， 那 么 我 们 有 : 

(IRxSx T=RxIS xT) 

{RESPIT=R PS TT), 

它们 同时 还 满足 交换 率 。 也 就 是 说 ， 对 于 所 有 的 RR 和 S$ 有 Rx S=S x 尺 和 R 多 S=S WRR 成 立 。 
我 们 在 习题 中 讨论 连接 的 其 他 性 质 。 

5. 除 运 背 

除 运算 是 我 们 介绍 的 最 后 一 个 自然 关系 运算 ， 考 虑 两 个 表 R 和 $、 这 里 $ 的 标题 是 R 的 标题 
的 子 集 。 特 别 地 ， 假 定 Head(R)- 和 有. 吾 …- 且 ,并且 Head(S)=B…B.。 

定义 2.7.5 除 表 T 为 RS( 读 作 R 除 以 S) 的 结果 ， 如 果 Head(T)=A…A, 并 且 T 中 包含 的 俗 
好 是 这 样 的 行 # 对 于 $ 中 每 一 个 行 * ， t 和 s 串 接 的 结果 的 行 可 以 在 表 R 中 找到 。( 关 于 t 和 s 溃 接 
的 会 闵 参 见 定 义 2.6.4)。 加 

表 S(Head(S)=B,…B.) 和 表 T=R:SCHead(T)=A mA) 之 间 没 有 共同 的 列 ， 但 是 因为 
Head(R)=A…A,B,…B。， 我 们 可 以 看 到 S$ 和 T 具 有 不 相交 的 标题 ， 所 以 有 可 能 T x 5=R( 或 者 
Tm S =R， 因 为 如 果 T 和 5 之 同 没 有 共同 的 属性 列 的 时 候 ， 连 接 和 乘积 是 等 价 的 )}。 这 恰好 是 
我 们 需要 定义 的 除 运 算 ， 也 就 是 乘积 的 道 运算 。 

定理 2.7.6 ”给 定 两 个 表 T 和 8$，Head(T)=A,…A, 旦 Head(S)=B…B。。 如 果 表 R 是 通过 有 =T 
x S$ 定义 的 ， 那么 有 T=R = SS 成立。 

证 因为 R=TxS， 所 以 有 Head(R)=A.…AB,…B。。 用 W 表 示 R + S$ 的 结果 表 ， 那 么 根据 定义 
2.7.5S 有 Head(WJ)=A,…A,， 且 W 具 有 和 T 相 同 的 标题 。 现 在 根据 乘积 的 定义 ， 如 果 元 组 弛 在 于 T 
中 ， 那 么 对 于 所 有 的 S 中 的 行 *，lls(t: 和 s* 串 接 ) 存 在 于 表 R=TxS 中 ， 而 在 定义 2.7.5 中 这 正 说 明了 
行 t 存 在 于 W=R : S 中 ， 因 此 我 们 得 到 了 T cW。 辐 理 可 证 W SET- 所 以 有 T=W 成 立 。 恬 

不 幸 的 是 ， 有 这 样 的 可 能 性 存在 : 我 们 从 表 R 和 $ 的 内容 入 手 ， 因 此 并 不 是 对 于 有 所 有 可 能 
的 T 都 有 R = Tx S$ 成 立 。 然 而 T 的 定义 表明 了 ， 当 T=R ;+ S 时 表 T 包 含 了 满足 T xS ER 的 最 大 可 
能 的 记录 集合 。 这 一 点 和 C 或 者 Java 中 的 整数 除法 x=y/z 类 似 ，x 是 满足 x x z=y 的 最 大 的 数学 。 
我 们 在 后 面 的 习题 中 可 以 看 到 更 多 相关 的 信息 。 
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例 2.7.9 给 定 表 R 如下: 





在 上 面 的 例 于 中 ， 注 意 到 所 有 的 行 9 x T 都 在 KR 中。 在 T 中 没有 更 大 的 行 的 集合 也 满足 这 个 
条 件 ， 因 为 在 吾 R 中 只 有 3 个 行 在 列 C 上 具有 值 c1。 


S T 

A 

| Lal bz | 

再 次 注意 ，S xT 中 所 有 的 行 都 在 R 中 ， 而 且 在 T 中 没有 更 大 的 行 的 集合 也 满足 这 个 条 件 ， 
我 们 可 以 根据 R 上 的 列 C 上 的 值 c2 得 到 这 个 结论 。 





$ x 了 中 的 所 有 行 都 在 R 中 ， 根 据 表 R 上 列 C 上 的 值 c3 和 ec4， 我 们 可 以 看 出 T 为 什么 是 具有 该 
性 质 的 最 大 集合 。 





这 里 我 们 看 到 的 例子 是 有 三 个 列 的 表 R 被 一 个 具有 两 个 列 的 表 S 除 ， 得 到 的 结果 表 T 只 有 单 
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- 列 。R 中 具有 B =b1 和 C=c1 的 行 只 有 两 个 ， 这 两 个 行 在 A 上 的 值 分 别 为 al 和 a2; 因 此 T 是 最 大 的 。 





这 里 我 们 很 容易 看 出 为 什么 T 是 本 例 中 最 大 集合 。 图 


接 下 来 我 们 要 纵 出 例子 来 说 明 除 运算 在 实际 查询 中 的 应 用 。 
例 2.7.10 假定 我 们 雪 求 取出 由 顾客 c006 订 网 的 商品 的 号 码 。 这 个 结 昌 存放 在 表 PC6 中 。 


PLé 





我 们 可 以 用 以 下 的 查 淘 得 到 该 结果 : 

PE6 := CORDERS where cld = cAI6' Jpid] 

我 们 更 感 兴 趣 的 是 找 出 所 有 的 订购 了 所 有 这 些 商 品 的 顾客 。 通 过 CP : 
=0RDERS [cid,pid] ， 我 们 可 以 从 表 ORDERS 中 提取 出 顾客 号 码 以 及 他 们 所 订购 的 商品 。 对 
于 我 们 需 间 的 查询 ， 韶 求 找 出 所 有 订购 了 PC6 中 全 部 商品 的 顾客 (用 ciq 值 唯一 标识 )， 可 以 应 
用 除法 运算 得 到 管 案 。 结 果 表 cP + PC5 如 下 : 


tp + PC 





从 本 例 中 可 以 了 解 到 ， 当 检索 要 求 中 包含 “所 有 ”字样 的 时 候 ， 我 们 就 可 能 需要 使 用 
除 运算 。 也 

在 例 2.7.10 中 在 被 ec6 除 之 前 把 ORDERS 报 影 到 列 cid 和 pid 上 而 不 是 在 除 运算 以 后 再 投影 
到 pid 上 是 完全 必 轰 的 。 否则 ， 我 们 可 能 被 村 求 表 ORDERS 上 额外 的 列 值 在 和 PC6 上 的 两 个 
pid 人 慎 做 串 接 的 时 候 保 持 不 变 。 为 了 说 明 这 一 点 ， 我 们 来 看 下 面 两 个 表 R 和 $。 





i ' 


进 2 莫 共 系 再 型 和 


一 行 a1。 另 一 方面 ， 如 果 我 们 想 把 表 R 投 影 到 属性 列 a 和 C 上 ，RI[a，C] 具 有 六 个 不 同 的 行 ， 
表 RIa,， el:S 具 有 了 唯一 的 列 a， 三 行 值 分 别 为 al ，a2 和 a3。 你 应 该 经 常 问 自己 作 除 运算 的 表 
中 哪些 列 ， 和 被 除数 的 所 有 行 串 接 的 时 候 应 该 是 保持 不 变 的 。 

例 2.7.11 ”我 们 可 以 用 下 面 的 式 子 来 回答 取出 所 有 订购 了 全 部 商品 的 顾客 的 名 字 这 一 检 
索要 求 : 

(ORDERSEeid, pid] + PRODUCTS[pid]Y pa CUSTOMERSIL enamel}, 

再 强调 一 下 ， 先 把 表 ORDERS 投 影 到 属性 cid，pid]l] 上 ， 以 便 结果 表 中 只 有 一 -个 属性 
ci 是 很 必要 的 。 具 有 一 个 顾客 c001 满 足 上 述 查 询 要 求 , 订购 了 所 有 的 商品 ，c001 就 正好 是 
结果 表 的 内 容 。 时 
2.8 运算 依赖 

2.7 节 定义 的 某 些 关系 运算 只 是 为 了 应 用 上 的 方 使 才 和 定义 的 。 在 革 种 意义 上 说 ， 关 系 代数 
的 全 部 功能 可 以 由 较 小 的 运算 子 集 来 完成 。 我 们 称 基本 运算 的 最 小 集合 由 并 、 差 、 乘 积 、 选 
择 和 投影 组 成， 加 上 人 允许 重 定义 属性 名 字 的 赋值 算 子 。 为 了 验证 这 个 命题 ， 我 们 需要 说 明 余 
下 的 运算 一 一 交 、 和 连接 和 除 一 一 可 以 如 何 用 基本 关系 运算 来 表示 。 交 和 连接 运算 很 容易 说 明 。 

定理 2.8.1 RR 和 S$ 是 两 个 兼容 表 ，Head(RY=Head(S)=A…AA,。 交 运算 可 以 被 减 运算 重 定义 
为 : ANB=A -(A-B), 

证 我 们 用 文 氏 图 说 明 : 

这 个 说 明 可 以 很 容易 用 自然 语言 表达 ， 如 果 需 要 的 话 。 





定理 2.8.2 ”给 定 两 个 表 R 和 SS，Head(RJ=A…AB Bi，Head(S)=B BC …C。， 其 中 中， 
， 丙 全 人 0， 民 和 S 的 连接 可以 用 积 、 选 返 、 投 影 运算 以 及 赋值 算 寺 重 写 。 

证 为 了 证 明 这 一 点 ， 考 虚 表 

T: =(Rx SYwhere R.B,=S.B1 and …and R.B,=53.n, 

甫 了 由 积 和 选择 加 作物 成 ， 这 和 RR 和 8 的 连接 类 似 。 现 在 我 们 兵 要 简单 地 用 投影 运算 把 不 
需 昌 的 重复 列 日 除 以 及 利用 大 和 值 算 子 重 定 义 列 名 。 

和 : TIR.A-,R.A,, RB ,R.B, SC 

T, (A A By B,C,Ca): =T1 

表 T2 结 果 和 R mS 相同 。 时 

要 说 明 除 运算 可 以 用 基本 关系 运算 代替 并 不 容易 掌握 ， 证 明 是 带 星 号 的 ， 这 就 意味 者 你 


42 恤 邦 谭 奈 型 、 笑 和 程 与 粒 能 


无 法 从 中 对 本 教材 加 深 多 少 了 和 解 。 这 个 证 明 是 为 那些 具有 非常 出 色 的 数学 背景 的 好 奇 的 读者 
提出 的 。 

定理 2.8.3* { 难 ] 除法 可 以 用 投影 、 乘 积 和 和 差 表达 。 

证 考虑 两 个 表 R 和 8S，Head(R)=A…A 了 …B, 日 Head(S)=B…B。 我 们 可 以 证 明 : 

RS= 有 [Ap 起 ] (RIA A,] x S)-R)[A, 上,]。 

假设 x 是 表 R{A,，…，A,] - ((R[A，…，A]xS) -RI[A，…，A 的 一 个 元 组 。 这 意味 者 
4 在 表 RIA，…，A] 中 ， 且 42 不 在 表 ((R[A，…，A]xS)-RIIA，…，A] 中 。 再 假设 $ 中 存在 
元 组 *， 使 得 zx 利 * 的 串 接 不 在 R 中 。 由 于 x 在 表 R[A,，…，A,] 中 ， 这 就 说 明了 4% 是 表 ((R[A,，…， 
A] x S) -RR)[A,，-……-，A.] 的 成 员 ， 这 就 与 想 设 相 予 秆 。 所 以 对 所 有 的 S 中 的 元 组 ?，u 和 s 的 连 
接 都 存 R 中 ， 这 意味 着 a 属于 表 R + 5。 

反 过 来 ， 如 果 z 是 R : S 中 的 -= 个 元 组 ， 显 然 # 在 表 R{[A,，…，AA,J] 中 。 另 一 方面 ，4 不 在 表 
((R[A，…，A]xS)-RI[A,，…，A] 中 ， 因 此 在 $ 中 存在 一 个 元 组 使 得 zx 和 xs* 的 串 接 在 R[A,， 
…，AA,] x S 中 而 不 在 R 中 。 因 此 w 属 于 表 R[Ai,，…， A,]-((R[A,, 7， A,] XS)-R)[A,, …， 
AA,]， 这 就 推出 了 我 们 的 命题 。 你 也 可 以 从 特定 的 表 中 用 刚 给 出 的 队 运 算 示例 中 推出 结果 。 

很 自然 ， 有 人 会 怀疑 上 面 说 的 基本 关系 运算 集 ( 并 、 差 、 奈 积 、 选 择 、 投 影 ) 是 否 就 是 最 小 
的 集 人 台 。 换 句 话 说， 我 们 是 否 可 以 找到 一 个 更 小 的 运算 集合 (在 上 述 五 神 和 运算 中 )， 使 得 这 些 运 
算 可 以 用 来 表达 所 有 其 余 的 运算 ?事实 上 这 五 个 关系 运算 确实 构成 了 最 小 集合 ,习惯 数学 推导 
的 读者 可 能 会 考虑 怎么 来 证 明 这 一 点 。 

关系 查询 诸 言 (如 关系 代数 或 者 SQL) 的 表达 能 力 就 在 于 如 何在 一 系列 现存 的 表 上 为 了 问答 
某 个 查询 而 建立 新 表 。 在 E. FE. Codd 1972 年 写 的 论文 中 ， 他 把 关系 代数 和 各 基于 符号 逻辑 的 元 
组 演算 做 了 比较 并 证 明 两 者 在 能 力 上 是 等 价 的 。 这 就 成 为 测试 关系 语音 的 标准 ， 即 必须 具有 
和 关系 代数 相当 的 表达 能 力 。 通 过 该 测试 的 查询 语言 称 为 完备 的 ， 或 者 是 关系 完备 的 、 并且 
所 有 的 流行 的 查询 语言 (如 SQL) 都 只 有 该 能 力 。 某 些 学 派 认 为 关系 代数 的 表达 能 力 是 不 够 的 ， 
我 们 将 在 本 章 的 后 续 部 分 进行 讨论 。 


2.9 综合 例子 


关系 代数 强大 的 功能 给 了 我 们 数据 查询 的 方法 ， 我 们 可 以 从 任意 数 大 的 表 中 取出 任意 列 
的 集合 《 通过 投影 )， 这 里 不 同 的 表 上 的 行 被 串 接 成 一 个 单一 的 行 (乘积 )， 然 后 根据 不 同 列 上 
的 条 件 做 限定 ( 选择 )。 可 以 不 考虑 并 和 差 运 算 ， 这 两 个 运算 增加 了 技术 的 能 力 ， 这 个 粗略 的 
表述 在 我 们 考虑 匹配 用 英语 表达 的 查询 的 时 候 给 了 我 们 许多 能 力 。 本 节 将 讲述 这 些 能 力 。 

本 和 节 我 们 要 推导 出 一 个 不 用 别名 建立 的 中 间 结 果 表 的 最 终 查 询 表 达 式 。 一 般 地 说 ， 用 单 
一 -的 自 含 的 表达 式 来 表达 一 个 最 终 查询 结果 效果 更 好 ; 我 们 在 后 面 练习 中 ， 对 于 不 一 定 需 要 
别名 的 练习 ， 要 求 用 单一 的 表达 式 解 答 。 注 意 ， 下 面 的 一 组 别名 定义 仅仅 是 对 CAP 表 的 缩写 。 


[ := CUSTOMERS。A := AGENTS, P := PRODUCTS. 0 :~ ORDERS. 
例 2.9.1 ”我 们 要 求 查询 所 有 订购 了 至 少 一 个 价值 为 $0.50 的 商品 的 顾客 的 名 字 。 对 于 这 样 
的 查询 通常 的 做 法 是 从 里 到 外 来 构造 查询 语句 。 首 先 ， 从 价值 $0.50 商 品 人 手 。 


P Where Price = .50 


我 们 怎么 样 才 可 以 找到 订购 该 商品 的 顾客 呢 ? 和 ORDERS 表 做 连接 ! 
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ip Where price = ND.50) bd 0 

这 个 结果 给 了 我 们 表 CRDERS 包 会 适合 的 商品 的 一 个 子 集 ， 并 且 扩 展 卫 商品 的 信息 。 不 幸 
的 是 ， 我们 还 无 法 从 中 得 到 顾客 的 和 名字， 只 有 订购 这 些 商 品 的 顾 窜 的 cid 值 。 自 然 的 想法 是 
把 这 个 结果 和 CUSTOMERS 表 做 连接 运算 ， 但 是 我 们 首先 必须 剔除 掉 这 个 结果 中 的 city 属 性 。 
最 好 的 方法 是 退回 来 开始 选择 PRODUCTS 的 时 候 就 对 pid 做 投影 ， 然 后 我 们 把 结果 和 
cUSTOEMRS 表 做 连接 ， 最 后 投影 到 最 终 要 求 的 cname 列 上 。 最 终 答案 如 下 ; 

(itp where price = OO.50)[pid} 时 日 bd CoLl cnamel 

广 意 , 表达 式 (P where Price=0.50) 在 对 [piqj 做 投影 之 前 被 放 人 圆 括号 中 去 了 ， 否则 ， 
根据 图 2-7 中 的 优先 级 表 ， 投 影 运 算 会 先 于 选择 运算 执行 ， 这 样 对 pr ice 的 选择 条 件 是 毫 无 意 
艾 的 。 在 和 DOD 做 连接 以 后 ， 结 果 表 达 式 (P where price = 0.50 )fpid] % O 也 再 次 被 放 人 图 
括 苇 中 ,这 是 因为 连接 是 个 二 元 运算 ,我 们 并 没有 定义 XMHY mzZ， 央 此 我 们 必须 写成 (Xm 
YZ。 有 一 道 习 励 要 求 你 说 明 连 接 运算 符合 结合 律 :(X WY) WZ = 外 (Y mmZ)， 因 此 我 们 可 
以 用 表达 式 X mY 四 Z 来 代替 其 中 的 什 何 一 个 。 最 后 ， 表 达 式 ((P where price=0.50)[piq] 
MO)mC 在 投影 到 cname 之 前 也 被 圆 括 号 包括 ; 和 否则， 表达 式 ((P where 
price=0.50)[pid] 0) MWCfcname] 会 在 做 连接 运算 之 前 把 C 投 影 到 cname 上 (参见 图 2-7)， 
这 样 我 们 就 会 驯 失 连接 列 cia。 国 

例 2.9.2 ”为 了 找 出 全 部 没有 存 代 理 商 a03 处 订购 商品 的 顾客 的 cid 值 ， 我 们 可 以 从 a03 处 
说 网 了 商品 的 顾客 人 手 : 


ORDERS where afd = "a03'} feid] 


那么 答案 显然 可 以 用 
0RDERSfcid] - (ORDERS where aid = 'a03') [cid] 
成 者 
CUSTOMNERSTICjd] — CORDERS Where aid = “a034') [cid], 
来 表示 。 
根据 我 们 最 初 所 重要 的 ， 第 一 个 查询 给 出 的 是 至 少 存 别处 订购 了 一 个 商品 的 顾客 的 cid 
值 ; 而 在 第 二 个 查询 中 把 那些 没有 订购 任何 商品 的 顾客 的 cid 也 查 出 来 了 。 我们 要 问 自 己 是 否 
过 要 把 这 些 “ 无 效 ” 的 顾客 放 人 我 们 的 结果 表 中 呢 ” 在 缺乏 足够 的 提示 的 情况 下 (如 果 查 询 要 
求 是 另外 - -个 人 短 出 ,我 们 无 法 征求 他 的 意见 )， 后 者 可 能 比较 合适 ， 因 为 它 包含 了 更 多 的 信 
居 。 国 
例 2.9.3 ”现在 我 们 来 考虑 那些 只 在 代理 商 a03 处 订购 商品 的 顾客 。 这 个 查询 可 以 从 曾经 从 
某 一 代理 ( 非 a03)? 订 购 商 品 的 顾客 人 手 ， 然 后 从 通过 a03 订 购 商品 的 顾 窜 列表 中 噜 除 上 述 顾客 : 


DRDERSCCTd] - 【ORDERS where aid “> ‘a03' [cidj] 四 


例 2.9.4 ”现在 我 们 需要 找 出 没有 被 任何 一 个 在 New Yotk 的 顾客 通过 在 Boston 的 代理 商 订 
购 的 所 有 商品 。 我 们 很 容易 找 出 不 符合 这 个 条 件 的 商品 ， 即 在 New York 的 顾客 通过 在 Boston 
的 代理 商 订 购 的 商品 : 

Cet where city = “New York [ed] pq ORDERSD) 
D3 A Where city = Boston’) [pid] 


和 和 前面 一 样 ， 人 选择 在 和 和 AA 选择 司 连 接 之 前 被 投影 到 了 cia 列 上 ， 有 所 以 连接 不 要 求 在 
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CUSTOMERS 和 AGENTS 两 个 表 中 的 city 值 匹配 。 现 在 我 们 需要 做 的 就 是 从 所 有 商品 列表 中 介 
除 这 些 商 品 : 


PRODUCTSLP1id] ~- 
(tC where city = New Tork' [eid] by ORDERS)} 
bd A where city = Boston'} Lpid] 


强调 一 次 ， 我 们 需要 判断 是 以 ERODUCTS [pid] 人手 ， 还 是 从 ORDERS[pid] 人 人 于。 前 者 
可 能 包括 了 没有 被 订购 的 “不 流动 ”的 商品 ， 而 后 者 列 出 了 那些 至 少 被 订购 一 次 的 商品 。 科 
例 2.9.2 一 样 ， 我 们 选择 给 出 更 多 信息 的 答案 ， 而 正 铺 的 现实 做 法 是 考虑 用 户 的 实际 需要 。 国 


例 2.9.5 ”取出 订购 了 所 有 那些 价格 为 $0,50 的 商品 的 顾客 的 名 字 ,。 要 得 到 这 些 顾 客 的 cid 
值 ， 根 据 线索 “ 谁 订购 了 所 有 的 商品 ”我 们 可 以 考虑 用 除 运算 来 得 到 这 些 顾 客 的 cid 值 : 


trcid, pid] + (P where price = 0.507[Lpid] 


要 得 到 这 些 顾 客 的 名 字 ， 我 们 还 需要 把 结果 和 表 CUSTOMERS 收 连接 然后 投影 到 cname 上 。 


{Ofceid, pid] + CP Where price 一 站 -50I[pid]y PA CYLcniame] 


例 2.9.6 ”取出 订购 了 吓 有 被 任何 人 订购 过 一 次 的 商品 的 顾客 的 cid 值 。 再 一 次 用 到 了 除 
运算 。 除 数 ， 即 “所 有 ”商品 的 列表 ， 需 要 从 ORDERS 表 而 不 是 PRODUCTS 表 投影 而 米 。 

Dtcid, pid] + OLpid] 

如 果 在 除数 中 用 P[pid] 代 替 的 话 ， 结 果 可 能 包括 一 些 最 近 被 列 人 商品 列表 中 ， 而 还 没有 
被 任何 顾客 订购 的 商品 ， 那 么 结果 表 中 的 cia 集 合 就 会 是 空 的 。 列 

例 2.9.7 ”取出 所 有 接 到 至 少 顾客 c004 订 购 的 商品 集合 ( 可 能 会 更 多 ) 的 订单 的 代理 商 的 
aid 值 。 这 个 看 起 来 很 难 的 查询 要 求 ， 可 能 只 需 重新 表示 。 试 用 这 样 一 个 要 求 : 取出 接 到 所 
有 c004 订 购 的 商品 的 订单 的 代理 的 aiq 值 。 


OLald, mid 十 《0 where cid = ‘co04' YLpid] 到 


例 2.9.8 ”取出 订购 了 p01 和 p07 这 两 种 商品 的 顾客 的 cid 值 。 要 注意 下 面 的 关系 代数 表达 
式 没 有 正确 地 回答 这 个 要 求 。 

0 where pid = "p01 and pid =-“p07 补 错 误 缚 果 # 

问题 在 于 ORDERS 表 中 的 每 一 行 在 pia 上 只 有 一 个 值 , 而 这 个 值 要 人 么 等 于 p01 要 么 等 于 p07， 
但 不 同时 等 于 两 者 。 正 确 的 答案 如 下 : 


‘0 where pid = "PDl'3feci1d] Mm (CC 0 where pid = ‘pO7 ICe1d] 


使 用 交 运 算 来 取出 同时 订购 了 p01 和 和 p07 的 顾客 。 国 


例 2.9.9 取出 从 至 少 一 个 接受 订购 商品 p03 订单 的 代理 商 处 订购 过 商品 的 顾客 的 cia 什 。 
如 图 2-9， 要 求 取出 的 顾客 在 最 右边 的 贺 中 表示 ， 它 只 和 中 间 贺 所 表示 的 代理 相关 。 特 别 要 注 
意 的 是 ， 要 求 检 索 的 cid 本 身 没 有 订购 商品 p03。 在 图 2-2 的 ORDERS 表 中 ， 我 们 可 以 看 到 第 四 
行 中 的 c001 通 过 代理 商 a06 订 购 了 商品 p03; 同 样 在 倒数 第 四 行 中 ， 顾 客 c004 通 过 代理 商 a06 订 
购 了 商品 p01， 因 此 ec004 应 该 被 包含 在 我 们 的 结果 表 中 ， 因 为 它 从 至 少 一 个 接受 订购 商品 p03 
订单 的 代理 商 (a06) 处 订购 了 商品 。 然 而 ， 我 们 可 以 检查 到 c004 没 有 订购 商品 p03。 


一 一 -一 = 一 一 一 本 。 1 ' =- - -| 
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对 于 这 个 查询 的 正确 的 做 法 是 从 里 到 外 ;从 图 2-9 的 中 间 的 圆 图 开始 ， 我 们 检索 出 接受 了 
商品 p03 订单 的 代理 : 


【Where pld = pO" [Lalid] 





网 2-9 例 2.9.9 中 的 对 象 集合 和 它们 之 同 的 连接 关系 


我 们 所 需要 的 结果 如 图 2-9 中 最 右 的 圆圈 表示 ， 需 要 检索 出 从 这 些 代 理 处 订购 商品 的 申 客 
的 cid 值 。 这 表明 需要 再 次 使 用 到 表 CRDERS， 为 了 安全 起 见 ， 我 们 使 用 一 个 不 同 的 别名 ，X 
: ~-ORDERS， 这 样 在 表达 式 中 的 列 名 就 不 会 混 清 ， 即 使 两 次 使 用 同一 个 表 : 

(X bd (0 where pid ~ ‘p03'}[Caid]}[Lcid] 

一 般 来 说 ， 如 果 表 达 式 中 没有 绞 积 运算 ， 而 对 同一 个 表 使 用 不 同 的 别名 有 点 舌 柱 过 正 ， 
但 是 我 们 这 里 使 用 了 这 种 方式 使 得 问题 的 解决 得 到 了 简化 。 加 

例 2.9.10 ”取出 所 有 具有 有 和 在 Dallas 或 者 Boston 的 顾客 相间 的 折扣 率 的 顾客 的 cid 值 。 这 
个 例子 说 明 : 如 果 查 询 中 包含 了 “所 有 ”这 个 词 不 一 定 要 使 用 除 运 算 。 实 际 上 这 个 查询 中 的 所 
有 一 词 具 有 误导 作用 。 查 询 要 求 可 以 重新 表达 为 如 下 我 们 所 熟悉 的 查询 要 求 : 取出 那些 具有 
和 在 ballas 或 者 Boston 的 顾客 相同 折扣 率 的 顾客 的 cid 值 。 关 键 在 于 当 我 们 要 求 取出 满足 
相同 条 件 的 顾客 的 ciq 值 的 时 候 ， 自 然 霸 要 检索 出 全 部 符合 要 求 的 顾客 ;但 时 这 并 没有 要 求 必 
须 使 用 除 运 算 。 要 回答 这 个 查询 ， 我 们 先 找 出 在 Dallas 或 者 Bostdn 的 顾客 的 所 有 折扣 率 。 

(C mwnere city 一“Dal1as” or city = "Roston’ }Ldiscnt] 

下 - 步 ， 要 找 出 具有 上 面 的 折扣 率 的 顾客 的 cid 值 ， 我 们 使 用 连接 运算 。 首 先 我 们 建立 
一 个 别名 ，D : =CUSTOMERS ， 然 后 给 出 表达 式 : 


i where city = Dallas’ or city = ‘Boston' [discnt] bd Orcid] 


这 些 从 表 了 和 所 有 的 折扣 率 集合 相连 接 所 得 的 cia 值 就 是 我 们 所 需要 的 答案 。 图 

例 2.9.11 现在 我 们 有 一 个 非常 复杂 的 查询 要 求 。 我 们 需要 列 出 通过 符合 下 列 条 件 的 代理 
商 订 购 的 商品 的 pid 列 表 。 这 些 代 理 商 从 可 能 不 同 的 顾客 处 接受 订单 ， 而 这 些 顾客 从 一 个 接 
受过 顾客 e001 订单 的 代理 商 处 订购 了 至 少 一 个 商品 。 要 建立 这 样 的 一 个 查询 表达 式 的 秘 庄 束 
是 安 下 心 来 从 里 到 外 解决 问题 。 

我 们 先 直接 给 出 接受 过 顾客 c001 订 单 的 代理 商 ; 

tO where cid = 0015 }[aid] 


接 下 来 ， 从 这 些 代 理 商 处 订购 过 商品 的 顾客 可 以 用 下 面 的 式 子 表示 : 


(x Im (DO where cid = ‘cADE' yaidl} [teid] 
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这 里 X : x=ORDERS。 肯 给 定 Y : =ORDERS、。 从 这 些 顾客 处 接受 过 订单 的 代理 商 可 以 通过 
下 面 表达 式 列 出 来 : 


{¥ bd (Xb DO where cid = "cO01 Laidli[tcid]itaid] 


最 后 令 Z : =ORDERS ,通过 上 述 代 理 商 订购 的 商品 的 pia 是 : 
{ZE OY Bd 0 where ci 一 cool [afo]lyrefdJyraidJyrrpig] 
这 就 是 我 们 最 初 所 需要 的 结果 。 国 
例 2.9.12 ”取出 没有 被 生活 在 以 了 DD 开头 的 城市 的 顾客 所 订购 的 商品 的 pid 值 。 怎 么 找 出 生活 
在 以 D 开 头 的 城市 的 顾客 呢 ? 回想 字符 串 在 字母 表 中 的 顺序 不 等 式 ， 下 面 的 表达 式 给 出 了 答案 。 


C where city > 一 DOD and tity < “上 E 


而 没有 被 这 些 顾 客 所 订购 的 商 贞 可 以 从 所 有 的 商品 中 减 去 这 些 顾客 所 人 订购 的 商品 而 得 到 |， 


P[p1d] - {0 bY (CG where eity > 一 DPD" and city < 'E'}))Epid} 加 


2.10 其 他 关系 运算 


到 目前 为 止 我 们 讨论 的 关系 运算 基础 集合 是 为 了 用 一 个 较 小 的 集合 来 表达 基 系 代数 中 对 
查询 要 求 的 处 理 。 在 理论 上 可 以 用 基本 运算 集合 来 表示 所 有 的 查询 。 然 而 ， 一 些 附加 的 运算 
可 以 使 得 表达 起 来 更 为 简单 ， 比 如 我 们 可 以 用 一 系列 的 基本 运算 来 表示 除 运算 。 

下 面 我 们 要 讨论 两 个 附加 的 很 有 用 的 关系 和 运算， 外 连接 和 9 连接。 这些 运算 的 作用 显示 在 
下 面 的 表 中 。 


键盘 格式 示例 
QUTERY RonS 或 ROUTERJ S$ 
LOUTERJ R os 或 R LOUTERJ S 


ROUTERY R epg S$ 或 R ROUTERJ S 
R JN(A2 > Bo) S 





外 连接 在 商业 数据 库 中 对 于 简化 查询 具有 特殊 作用 。 对 于 这 样 的 连接 运算 在 原先 的 许多 
查询 语言 中 都 被 溃 沁 了， 面 现在 叉 全 补 上 。 这 丙种 运算 都 可 以 用 五 种 基本 运算 来 表达 ,但 是 
对 外 连接 的 表达 在 实际 上 并 不 容易 使 用 。 

1. 外 连接 

介绍 外 连接 我 们 需要 用 到 两 个 表 : 表 a&GENTS 和 一 个 新 表 SaALES。 前 者 我 们 已 经 接触 过 了 ， 
后 者 包含 两 列 :出 现在 表 CRDERS 中 的 代理 商 的 aida 和 一 个 tetal 列 给 出 了 每 一 个 代理 商 的 营 
业 额 。 如 果 代 理 商 没有 收 到 任何 订单 ， 我 们 就 假定 该 代理 向 的 ai ad 值 不 出 现在 SALES 表 中 。 
观 在 我 们 需要 打印 一 张 提 供 了 所 有 的 代理 商 名 字 、 他 们 的 aia 以 及 音 业 辕 的 表格 (作为 销售 经 
理 的 报 囊 )。 销 售 经 理 熟悉 所 有 的 代理 商 和 名 字 ， 用 aiqa 仅 仅 是 为 了 区 分 相同 的 代理 商 名 字 。 人 称 
可 能 会 认为 这 只 要 简单 地 写 出 关系 代数 表达 式 (AGENTS m SALES) [aname, aid, total]。 
但 是 这 个 结果 遗漏 了 某 些 代理 商 的 名 字 : 如 果 这 个 代理 商 没 有 收 到 任何 订单 ， 那 么 根据 假定 ， 
他 的 cid 将 不 会 出 现在 SaLES 表 中 ， 当 然 在 结果 的 报表 中 也 不 会 出 现 。(5aLES 表 中 没有 aia 
值 可 以 和 acGENTS 表 中 的 aiq 做 连接 )。 销 售 经 理 当然 不 希望 有 代理 商 的 各 字 遗 漏 在 结果 报表 


彩 2 章 关系 模型 47 


外 ， 即 使 他 没有 收 到 任何 订单 。 实 际 上 ， 这 可 能 需要 人 二 干涉。 我 们 也 可 能 遇 到 这 样 的 情况 : 
一 个 新 的 名 叫 Beowulf 的 代理 商 ，aid 为 a807。 在 这 个 信息 没有 更 新 到 AGENTS 表 之 前 ， 他 收 到 
了 订单 ， 然 后 在 SaLES 表 中 播 信 记录， 那么 我 们 再 一 次 遇 到 这 样 的 问题 表达 式 
(AGENTS mSALES) [Ianame，aid，total] 无 法 给 出 销售 经 理 满 意 的 答案 。 因 为 SALES 中 
的 aid 列 无 法 和 AGENTS 中 的 aid 相 号 配 。 外 连接 运算 ， 用 mw 表示， 可 以 帮助 我 们 解决 这 个 
问题 。 我 们 给 出 的 答案 是 : 

hired and has taken an order that shows up in the SALES rable hefore any information on 

这 样 就 可 以 得 到 了 两 个 表 中 的 所 有 值 了 。 在 代理 商 没 有 收 到 订单 的 情况 中 ， 我 们 检查 到 
SALES 表 中 没有 一 个 营业 和 额 的 值 ， 那 么 在 结果 表 中 对 应 的 营业 额 的 值 被 俯 上 了 null。 同样 对 于 
收 到 了 订单 而 在 AGRNTS 表 中 没有 名 字 的 情况 也 是 如 此 处 理 。 我 们 可 以 看 到 奴 下 的 结 米 : 


OJRESULT 


rr 











所 有 的 没有 匹配 的 列 的 值 都 显示 在 了 外 连接 的 结果 中 了 。 人 代理 商 Gray，a04， 没 有 收 到 任 
何 订 单 ， 因 此 他 的 total 列 上 的 值 是 null。 代 理 商 Beowulf，a07， 在 aname 列 上 的 值 汐 null. 

为 了 定义 外 连接 运算 ， 考 虑 表 R 和 S，Head(R)=Al…A,B,…B, 昌 Head($)=B,…BC,.…C,， 
这 里 nh， 玉宇 0。 

定义 2.10.1 “外 连接 ” 表 R 和 8 的 外 连接 R m0S、 其 标题 Head(R M0S)=A,…A,B,…BC.… 
C.。 行 ! 属 二 天 Rao， 如 果 下 列 情况 之 一 发 生 : 

1) 两 个 可 连接 的 行 w，v 分 别 在 R 和 SS 中， 对 于 所 有 的 i，0 志 i， 有 BB,]=v[B,] 成 立 。 在 这 
种 情况 下 我 们 道 过 以 下 方式 定义 t: 对 于 所 有 的 1 所 in ,A=4[Al; 对 于 所 有 1 所 i 和 此， 
t[B,]=u[B,]， 对 于 所 有 1 志 j 专 mm ， tC,]=v[C,]。 

2) 表 R 中 的 一 个 行 4 使 得 8 中 没有 一 个 可 以 于 之 连接 的 行 vw”， 在 这 种 情况 下，i[D]=#[DI 对 于 
所 有 的 标题 Head(R) 中 的 PD。 而 对 于 所 有 的 在 {Cl，…，} 中 的 D，itD] 上 的 值 为 noll。 

3) 表 S$ 中 的 一 个 行 v， 而 R 中 没有 一 个 可 以 于 之 连接 的 行 &， 在 这 种 情况 下 ， 对 十 所 有 的 标 
题 Head(S) 中 的 D。!D]=v[D]。 而 对 于 所 有 的 在 {A,，…，A,) 中 的 D，!D] 上 的 值 为 nul ， 本 


我 们 说 外 连接 保留 了 未 匹配 的 行 ， 也 就 是 说 在 外 连接 一 端的 表 上 的 行 ， 即 使 在 胃 一 - 端 上 
的 表 中 没有 与 之 相 匹 配 的 连接 列 值 也 会 出 现在 外 连接 的 结果 中 。 而 左 外 连接 和 和 右 外 连接 运算 
只 是 因为 我 们 需要 在 某 一 边 上 保留 未 匹配 的 行 而 已 。 左 外 连接 保留 了 在 操作 答 左 边 的 森严 配 
行 ， 而 右 外 连接 正好 相反 ， 保留 在 右边 出 现 的 外 连接 。 比 如 说 ， 我 们 有 个 表 
gpECIAL _AGENTS 和 AGENTS 茹 容 ， 只 不 过 包含 的 是 特殊 的 代理 商 的 行 (如 a01，a04，a06 等 )。 
现在 对 这 个 表 我 们 想 看 到 和 上 面 OJRESULT 同 样 的 有 关 代 理 的 报案 。 如 果 我 们 使 用 内 达 式 : 
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tSPECTAL AGENTS cd SALES?Canama，aid。total]， 


我 们 看 不 到 有 关 代 理 商 a04 的 为 nul 昔 业 额 值 。 而 如 果 我 们 使 用 表达 式 : 


{SPECIAL AGENTS [xm SALES)[aname. aid, total], 


我 们 可 以 看 到 结果 中 包含 了 所 有 的 代理 商 ， 不 仅仅 是 a01，a04 和 a06。 而 在 
SPECIAL_AGENTS 表 上 没有 的 aname 值 的 代理 商 的 车 业 额 为 null。 
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这 是 用 SFECIAL_AGENTS 人 代替 AGENTS 表 做 外 连接 所 得 的 结果 。 但 是 我 们 想 知 道 的 仅仅 
是 在 SPECIAL_AGENTS 表 中 存在 的 代理 的 报表 。 一 个 公司 有 数 千 个 代理 南 ， 得 到 所 有 的 并 不 
需要 的 额外 信息 是 一 个 很 严重 的 问题 。 为 了 正确 得 到 我 们 想 要 的 ， 我们 可 以 用 左 外 连接 运算 ， 
表达 式 为 ; 

(SPECIAL AGENTS pqLO SALES YLaname. aid, totall, 


结果 如 人 下: 


LDORESULT 


ere a tar 


oy | wr 
EEC 
这 就 是 左 外 连接 表 的 结果 ， 显 示 的 正 是 我 们 所 需要 的 信息 。 作 为 右 外 连接 的 例子 我 们 可 以 通 
过 如 下 表达 式 得 到 同样 的 结果 : 





(SALES Pp SPECIAL AGENTSIEaname, 31d, total] 

我 们 把 这 个 作为 练习 ， 要 求 你 说 明 怎么 修改 定 交 2.10.1( 外 连接 运算 ) 来 给 左 外 连接 和 右 外 
连接 下 一 个 正确 的 定义 。 

2. 8 连接 

当 和 连接 两 个 表 而 表 中 的 同名 属性 并 不 是 需要 等 秆 的 时 人 息 ， 我 们 可 以 使 用 8 连接 。 符 惫 代表 
着 在 6 连接 中 的 不 同 的 表 中 的 相关 属性 之 间 的 比较 运算 符 ， 它 可 以 是 >，<，>=，<=，=，<>。 

定义 2.10.2 9 连接 R 和 $ 是 两 个 表 ，Head(R)=A 上 日 Head(S)=3…B,。 我 们 允许 Head(R) 中 
的 任何 属性 A 可 以 和 Head(S) 中 的 任何 属性 也 同名， 但 是 不 需要 指定 任何 属性 是 共用 的 。 假 设 属性 
A 和 B 具有 相同 的 域 ， 而 关系 运算 符 6 是 集合 人 2，<，>=，<=，=，<>} 中 的 一 个 。 如 果 A, 利 B 具 有 
不 同 的 名 字 ， 那么 R 和 S 的 9 连接 是 表 T : =R 多 AGBS， 这 里 Head(R mA9BS)=A…AB…B,。 


— ht 
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否则 ， 如 果 A, 和 B, 具 有 相同 的 名 字 ,， 我 们 必须 限定 表 R 和 8$ 的 6 连接 ，T : =R % R.A。 5。 


下 面 我 们 将 假定 使 用 未 受 限 定 的 名 字 。 
新 表 的 行 具有 格式 t=(a,， "a b,, …:， b.), 这 里 ， ABb, (al，, a,) 在 RR 中 ， [bi ，… 
b,) 在 S 中 ,很 容易 看 出 9 连接 辣 以 用 基本 关系 代数 操作 符 表达 。 层 


例 2.10.1 找 出 所 有 商品 数目 超过 了 当前 手头 上 拥有 的 商品 的 数 日 的 订单 的 cordno 值 。 这 
可 以 用 8 连接 解决 : 
(CURDERS % DRDERS .qty > PRODUCTS. quantity PRODUCTS)[ordno] 


这 等 价 于 关系 代数 表达 式 : 


CORDERS i PRODUCTS) where ORDERS .9ty > PRODUCTS. quantity’[ordno) 国 


条 件 ORDERS .qty > PRODUCTS .quantity 称 为 8 条件。 更 普遍 地 称 本 例 中 的 6 连接 为 大 
于 连接 。 而 普通 的 连接 运算 符 称 为 等 值 连接 ， 或 者 为 自然 连接 。 
推荐 读物 

关系 模型 还 有 许多 内 容 在 本 章 中 没有 涉及 到 。David Maier 给 出 了 相当 先进 并 日 优 秀 的 理 
论 "。 而 E * F Codd 的 关系 代数 的 基础 文献 可 以 在 推荐 读物 [1] 中 的 1.2 小 节 中 找到 。 这 些 读 物 
中 的 其 他 文献 也 是 很 有 用 的 。 

[1] E.F. Codd.” A Relational Model of Data for Large Shared Data Banks.” In Readings in 

Daitabase Systems, 3rd ed.Michael Stonebraker and Joseph M. Hellerstein, editors. San 


Francisco:Morgan Kaufmann, 1998. 
[2] David Maier. The Theory of Relational Databases. New York: Computer Science Press, 1983. 


习题 
下 面部 分 习题 在 本 书后 面 的 “习题 解答 ”中 给 出 了 答案 ， 这 些 习 题 用 * 标 出 。 


2.1 假设 本 是 所 用 的 表 与 例 2.4.1 中 的 表 相 似 , 通过 观察 各 行 的 内 容 ， 我 们 可 以 仅 根 据 表 
的 内 容 来 判断 设计 者 考虑 该 表 键 的 意图 。 


T1 
NN 
ECSESNEN 
EENES 
ECIENES 
ECEIENEY 


(a)。 找 出 上 面 的 表 T1 的 三 个 异 选 键 ， 其 中 一 个 候选 键 包 含 两 个 列 。 
(b) 找 出 下 面 的 表 T2 的 两 个 候选 键 。 
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(cj 给 出 像 洒 十 (a) 那 样 的 一 个 表 的 例子 ， 要 求 有 四 列 且 只 有 四 行 ， 但 是 只 有 - -个 候 
选 键 由 前 三 个 列 组 成 。 要 注意 ,前 三 列 ， 不 能 两 两 唯一 标识 所 有 的 行 。 
(d 给 出 像 习题 (b) 那 样 的 一 个 表 的 例子 ， 要 求 有 五 列 a、B、C、D、E 以 及 四 行伍 
是 只 有 一 个 候选 键 由 前 四 个 列 组 成 。 并 要 求 说 明 为 什么 该 表 中 没有 其 他 的 列 的 
集合 构成 键 。 
2.2 考虑 一 个 电话 公司 的 数据 库 系 统 ， 该 数据 库 中 包 信 了 表 SUBSCRIBERS， 其 标题 是 : 


name ssn address city zip information-no 


假设 information-no 是 提供 给 用 户 的 唯一 的 10 位 的 电话 号 码 ， 包 括 区 号 。 上 尽管 一 个 用 
户 可 能 有 多 个 电话 号 码 , 但 是 其 他 的 备 选 号 码 和 存放 在 一 个 单独 的 表 中 ; 当前 的 表 中 对 于 答 一 
个 几 户 都 有 唯一 的 行 ( 率 夫 和 和 法子 可 能 同时 申请 ， 可 能 会 在 表 中 占据 两 行 ， 但 是 具有 唯一 的 信 
息 友 information-no)。DBA 已 经 建立 了 该 表 的 以 下 规则 来 反映 设计 者 对 数据 的 意图 : 

售 没有 两 个 用 户 ( 在 不 同 的 行 上 ) 具 有 相同 的 社会 保障 与 。 

令 两 个 不 同 的 用 户 可 以 共享 相同 的 信息 号 码 (比如 丈夫 和 玫 手 的 例子 )， 他 们 在 
SUBSCRIBERS 表 中 占据 不 同 的 两 行 。 然 而 ， 同 名 用 户 不 能 共享 同 - -个 地 址 、 城 市 、 邮 编 而 且 
不 能 共享 同一 个 信息 号 码 。 比 如 ，Piane 1saacs 和 David Isaacs 住 伟 一 起 ， 具 有 相同 的 信息 码 ， 
如 果 他 们 想 要 在 数据 库 中 都 以 D.Issaes 存 放 的 话 ， 需 要 区 分 他 们 的 名 字 ， 也 就 是 说 ， 至 少 要 求 
他 们 中 的 某 一 -个 以 全 名 存储 。 

(als 根据 上 面 的 假定 ， 指 出 表 3SUBSCRIBEERS 的 所 有 的 候选 键 。 这 样 的 候选 键 有 二 
个 ， 其 中 一 个 包含 information-no 属 性 ， 另 一 个 包含 zip 属 性 。 
，{b) 你 会 选择 哪 一 个 候选 键 作为 表 的 主键 ? 为 什么 ? 

2.3 在 2.2 节 中 的 “ 表 和 关系 ”部 分 ， 我 们 定义 了 和 铺 卡 儿 积 :CP=CIDxCNRAME x CITYx 
DISCNT。 在 例 2.2.1 之 前 的 段落 中 ， 我 们 措 出 没有 必要 在 表 CUSTOMERS 中 包含 所 有 的 笛 卡 儿 
积 的 行 ， 因 为 如 果 CNAME，CITY 和 DISCNT 的 域 中 任何 一 个 包含 也 个 值 ， 那 么 在 箔 卡 儿 积 
中 将 至 少 有 两 行 具 有 相同 的 CID 值 。 华 例 说 明 这 一 点 ， 并 兰 述 只 要 CE 中 存在 这 些 行 ， 孝 么 这 
个 结论 总 是 正确 的 。 

2.4 用 关系 代数 来 解 块 有关 CAP 数 据 库 的 查询 。 这 些 习 题 是 很 基本 的 ， 是 后 面 系统 的 上 大 
础 。 

(a)* 找 出 订单 总 价 大 于 或 者 等 于 $1000 的 (cordne，pid) 对 。 

(b) 找 出 所 有 价 烙 在 和 .50 和 $1.00 之 间 的 商品 的 名 字 ， 和 包括 边界 价格 。 

(cj 找 出 订单 价格 低 于 $500 的 (ordqno、cname}) 对 。 使 用 一 次 连接 。 

(d) 找 出 所 有 三 月 份 接受 的 订单 的 (cordno，aname) 对 。 使 用 - -次 连接 。 

(ey* 找 出 所 有 三 月 份 接受 的 订单 的 (ordno ，cname ，aname) 二 元 组 。 使 用 两 次 连 

(Dn 找 出 所 有 位 于 New York 的 代理 商 ， 并 月 要 求 这 些 代理 商 所 接 党 的 单个 订单 价格 
少 于 $500。 

(g)* 找 出 所 有 三 月 份 证 购 的 Duluth 的 商品 的 名 字 。 

2.5 用 关系 代数 来 解决 有 关 CAP 数 据 库 的 查 商 。( 这 些 查询 要 求 在 下 一 章 中 用 于 兰 述 基于 
计算 机 的 查询 语言 SQL 的 功能 .) 注意 ， 对 于 于 面 的 所 有 查询 ,再 要 用 单个 的 自 舍 式 关 系 代 数 
表达 式 来 解决 ， 苦 无 必要 不 能 依赖 任何 通过 使 用 别名 得 到 的 中 间 结 果 。 


(3aj 。 


(UP 
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找 出 所 有 顾客 、 代 理 商 各 商品 都 福 同 一 个 城市 的 三 元 级 (cid, aid, pid). 
本 古 不 涉及 iJ 单 信息 。 

找 出 所 有 顾客 、 代 理 商 和 商 师 不 者 在 同 - -个 城市 (可 能 有 了 两 个 在 同一 城市 ) 的 二 
元 组 (cid, aid, pid)。 

找 出 所 有 顾客 、 代 理 简 和 商品 两 两 不 在 同一 个 城市 的 三 示 组 (cid,， aid, piqd). 
取出 接受 顾客 c002iJ 单 的 代理 商 所 在 的 城市 。 

取出 至 少 被 一 个 在 Dalias 的 顾客 通过 位 于 Tokyo 的 代理 商 订 购 的 商品 的 名 宁 ， 
取出 曾经 收 到 Kyoto 的 顾客 订单 的 代理 商 所 销售 的 所 有 的 商品 的 pid 值 ; 注意 ， 
本 题 和 要 求 取 出 所 有 曾经 被 Kyoto 的 顾客 订购 的 商品 不 同 。 

列 出 所 有 在 同 -个 城市 的 代理 商 的 aid 对 。 

找 出 没有 通过 代理 商 a03 订 购 过 商品 的 顾客 的 cid 值 。 

找 出 折扣 率 最 太 和 最 小 的 顾客 的 cid 值 。 注意， 用 关系 代数 提供 的 运算 来 表 
砂 本 题 比 较 刚 难 。 

找 出 订购 了 所 有 商品 的 顾客 的 cid 值 。 

找 出 通过 代理 商 a03 而 不 通过 代理 a06 订 购 的 商品 的 pid 值 。 

取出 商品 的 pmame 和 Pia 值 ， 要 求 这 些 商品 所 在 的 城市 和 某 个 销 焦 过 该 商品 
的 代理 商 所 在 的 城市 相同 。 

取出 名 字 是 以 字母 N 开 尖 的 代理 商 的 aida 和 aname 值 ， 并 且 这 些 代 理 没 有 销售 
过 任何 Newark 生 产 的 商品 。 

取出 同时 订购 了 商品 p01 和 p07 的 顾客 的 cid 值 。 

取出 销售 过 所 丰 曾 被 顾客 c002 订 购 过 的 商 旧 的 找 理 商 的 名 字 。 

取出 销售 过 所 有 曾经 被 革 些 顾客 订购 过 的 商品 的 代理 商 的 名 字 。 

取出 所 有 的 三 元 组 (cid，aiqd，pid)， 要 求 对 应 的 帮 客 ， 代 理 商 和 和 商 上 丰 中 至 
少 有 两 者 是 位 十 同一 座 城 市 。{ 本 题 的 要 求 和 习题 (a)，(b)，(c) 相 间 么 2?) 
取出 所 有 曾 在 代理 商 a03 处 订购 商品 的 顾客 订购 过 的 商品 的 Pia 值 。 

取出 接受 过 Kyoto 的 顾客 一 笔 总 额 超过 $500 的 订单 的 代理 商 的 aia 值 ， 

给 出 所 有 的 (cmname，aname)? 对 ， 要 求 对 应 的 顾客 曾经 在 对 应 的 代理 踢 处 订 
购 过 向 品 。 

[ 难 ] 取 出 只 从 一 家 代理 商 处 订购 过 商品 的 顾客 的 ciq 值 - 

定 如 例 2.6.1 中 的 表 R 和 8， 要 求 列 出 表 RJOINS 的 内 容 。 


(by 证 明 ， 如 果 HeadtRJN Head(S8)= 信 (没有 共同 的 别 属性 }， 那 么 肯 R x $ 等 于 表 R % 
S55。 在 这 里 ， 如 果 说 两 个 表 相 等 措 的 是 两 个 表 具 有 相同 的 标题 和 内 容 ， 表 中 行 的 
次 序 不 改变 表 的 内 容 。 如 果 你 无 法 从 数学 上 证 明 该 命题 ， 请 阐述 为 什么 这 围 表 R 


x 3 等 于 表 R mM 5。 


2.7。 及 和 S 是 没有 共同 属性 的 两 个 关系 ， 同 习题 2.6 请 说 明 R MI SS=R&. 
2.8 根据 定理 2.8.2， 表 达 式 RM S 可 以 用 冬 积 、 选 择 和 投影 运算 来 表 过 ， 
(ajs 请 说 明 奸 连接 也 可 以 用 其 他 的 运算 代替 。 你 可 以 使 用 -一 般 连 接 、 并 、 乘 积 、 选 


择 和 投影 。 


(b) 请 说 明 6 连 接 也 可 以 用 乘积 、 选 择 和 投影 表 水 。 
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2.9 解释 为 什么 对 于 所 有 的 表 R、S$ 和 T， 下 面 的 等 式 总 成 立 。 
{ajs IR mm SIT=RmIS mT) 
(b} RMS=SmR 
2.10 证 明 : R MS = RNMmS， 当 且 仅 当 R 和 S$ 是 兼容 表 。 
注意 :下 面 的 习题 需要 某 些 数 学 方面 的 训练 。 
2,1l* 说 明 对 于 表 R 上 的 任何 条 件 C1 和 C2， 下 面 的 查询 是 等 效 的 : 
{R where C1) Where C2 
(R where C2} where Cl 
R where (Cl] and C2) 
2.12 ”证明 对 于 任意 表 R， 表 R 上 的 属性 A， 以 及 和 的 域 上 的 某 个 值 a， 必 定 存 在 表 $, 使 得 
选择 (R where A = a) 可 以 表达 成 R 四 S,。 这 里 的 表 S, 独 立 于 表 R。 
2.13。 有 和 $ 是 两 个 兼容 关系 ， 如 果 把 R 和 $ 看 成 是 元 组 的 集合 ， 那 么 ， 如 果 R 中 的 每 一 个 
元 组 都 存在 于 8 中 我 们 可 以 使 用 集合 的 符号 来 表示 包含 关系 ， 记 作 R ES。 证明 : 如果 及 等 S， 
那么 RR MT CS mT; 如 果 U 和 V 是 具有 相似 标题 的 两 个 表 ， 那 么 U 主 RDUSS ,REYDS+ 
V; 如 果 C 是 一 个 条 件 ， 那 么 (R where C) CE(S where 大 )。 
2.14 有 R 和 8 是 两 个 关系 ，Head(R)=H 有 旦 Head(S)=K。 证 明 下 面 的 等 式 上 成 立 : 
fR bd SS [H] = R CHT DO SIH my KI = R BA SEH m Kl], 
这 些 关 系 的 值 称 汐 RR 和 S$ 的 半 连 接 。 记 作 RXx5S。 
注意 ，R x $ 与 Sk 不 等 价 ， 半 连接 x 在 分 布 式 数据 库 中 具有 相当 宣 要 的 作用 。 
2.15 有 R 和 $ 是 两 个 兼容 关系 ，H 是 两 者 的 共同 标题 的 子 集 的 属性 的 集合 。 证明 下面 的 等 式 
或 者 举 出 反例 。 
(a) (RM WIH] = RLH} NM SHI] 
(bi (R U SYH] = R[H]I UY SI 
(ce) (RR - SYH] = REH] - SLHI] 
如 时 你 能 举 出 反例 ， 请 说 明 等 式 的 一 边 包 含 在 崩 外 一 边 。 
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本 章 介 绍 数 据 库 诸 言 SQL 的 基本 形式 。SQL 是 一 种 允许 我 们 对 计算 机 化 的 关系 数据 库 进 行 
查询 和 操纵 的 语言 。 自 从 20 世 纪 80 年 代 早 期 以 来 ，SQE 训 一 直 是 关系 数据 库 管 理 系 统 
(RDBMS) 的 语言 ， 而 且 它 对 本 书 列 出 的 许多 概念 都 有 着 重要 的 意义 。 现 在 ，SQL 语言 正 从 关 
系 形 式 (ANSI SQL-92 标 准 ) 转向 对 象 -关系 形式 【ANSI SQL-99 标 准 ，1999 年 颁布 ) SQL- 
99 应 被 视 为 SQL-92 的 扩展 ， 它 并 没有 改变 任何 有 效 的 早期 语言 。 本 章 介绍 的 SQL 基本 形式 (或 
基本 SQL) 和 包含 了 在 绝 大 多 数 主要 数据 库 产品 中 使 用 的 SQL-92 和 SQL-99 标 准 的 所 有 关系 性 能 。 
在 一 般 情况 下 ， 我 们 定义 的 基本 SQL 与 ANSI SQL 标准 的 基本 子 集 最 为 接近 ， 分 别 被 称 为 Entry 
SOL-92 和 Core SQL-99。 我 们 也 将 介绍 Entry SQL-92 和 Core SQL-99 之 外 .一 些 已 被 广 泛 实 现 的 
特征 。 在 定义 基本 SQL 时 我 们 的 试金石 是 要 提供 -- 种 绝 大 多数 主要 RDBMS 产 品 完全 支持 的 语 
法 。 第 4 章 将 涉及 更 加 新 的 对 象 - 关 系 语 法 , 它 将 在 新 的 方向 上 对 基本 SQL 进行 扩展 .在 第 3、4 
章 里 ， 我 们 将 给 出 在 常用 数据 库 产品 中 甘 繁 出 现 的 例子 。 


3.1 引言 


我 们 首先 从 总 体 上 介绍 SQL 的 特性 ， 然 后 说 明 多 种 SQL 标 准 和 产品 语言 以 及 我 们 在 具体 
的 叙述 中 将 如 何 处 理 这 些 标准 和 产品 语言 。 

1. SQL 特 性 

在 第 2 章 中 我 们 看 到 了 如 何 构 造 关系 代数 查询 来 回答 对 数据 库 信息 的 查询 请 求 。 在 第 3 草 
里 我 们 将 学 习 如 何 使 用 Select 语 句 这 样 的 形式 来 构造 相应 的 SQL 查 询 。 我 们 将 会 看 到 ， 在 构造 
查询 时 SQL 的 Select 语 句 在 许多 方面 都 要 比 关系 代数 更 为 灵活 。 然 而 ， 利 关系 代数 相 比 ， 吏 能 
力 而 言 ，$QL 并 没有 根本 的 改进 。 对 于 一 些 经 过 精心 考虑 的 扩展 语法 来 说 .其 中 没有 一 种 是 
关系 代数 所 不 能 实现 的 。 正 因为 如 此 ， 在 关系 代数 查询 方面 的 经 验 可 以 成 为 用 SQL 来 实现 查 
测 的 良好 借鉴 。 同 时 ，SQL 和 关系 代数 在 许多 方面 的 概念 模型 又 有 着 相当 大 的 差异 ,而 在 融 悉 
美 系 代数 方法 的 过 程 中 非得 的 认识 能 增强 对 SQL 能 力 的 理解 。 

你 将 过 到 的 最 重要 的 SQL 特征 是 它 在 计算 机 环境 下 交互 地 枸 造 查 询 的 能 力 。SQL 的 Select 
语句 比 相 对 简单 的 关系 代数 更 为 复杂 也 更 难 掌握 ， 但 只 要 有 机 会 上 机 ， 只 需 几 个 实验 就 能 打 
消 你 对 使 用 SQL 所 持 的 怀疑 态度 ， 你 也 就 不 会 再 感到 疑惑 或 动 播 了 。 本 章 讨 沦 的 交 筷 式 环境 
介 许 你 在 显示 屏 上 键入 一 个 查询 并 且 立 即 得 到 管 案 。 这 种 交互 式 查 询 有 时 被 称 做 即席 查询 。 
这 个 术语 涉及 到 这 样 一 个 事实 ， 即 一 个 SQL Select 语 名 是 在 键 人 一 些 输入 行 之 后 立即 形成 的 ， 
并 且 对 一 个 用 户 来 涪 该 语句 不 依赖 于 前 而 的 任何 交互 操作 。 这 种 不 依赖 于 用 户 会 话 中 前 面 交 
瑟 操 作 的 性 质 也 被 称 做 非 过 程 性 。SQL 在 这 方 而 也 不 同 于 关系 代数 ， 因 为 在 关系 代数 中 为 了 
表示 一 个 表 与 自身 的 笛 卡 儿 积 ， 前 而 可 能 需要 一 个 定义 表 别 名 的 语句 。SQL 与 诸如 Java 或 C 之 
类 的 过 程 性 语言 之 韶 的 差别 是 深刻 的 ; 你 不 需要 为 了 实现 一 个 SQL 查询 所 完成 的 功能 而 编写 
-个 程序 ， 你 只 需要 输 人 相对 较 短 的 、 独 立 的 查询 文本 然后 提交 。 

当然 ， 一 个 SQL 查询 可 能 会 相当 复杂 。 在 图 3-1 中 我 们 列 出 了 基本 SQL Select 语 名 的 完整 


54 笋 据 古 上 原理、 组 程 与 性 能 


形式 。 这 个 完整 形式 的 一 个 有 限 的 部 分 被 称 为 子 查询 ， 对 它 的 定义 是 递归 的 ， 而 完整 的 SQL 
Select 语 名 形式 有 一 个 子 句 。 不 管 怎么 说 ， 你 不 应 被 SQL 语句 的 复杂 性 吓 倒 。Select 语 句 的 非 
过 程 性 意 昧 着 它 与 使 用 菜单 的 应 用 有 许多 共 同 之 处 。 在 使 用 菜单 的 应 用 中 ， 用 户 入 要 从 菜单 
中 填写 一 组 选项 然后 按 下 回 车 键 来 立即 执行 它们 。Select 语句 的 各 种 子 句 对 应 于 菜单 选项 ; 
你 偶尔 会 需要 所 有 的 子 句 ， 但 并 不 需要 在 每 次 查询 的 时 候 都 用 上 所 有 的 子 铝 。 


subquery 一 
SELECT TALL | DISTINCTJ © * | expr [LAS] c_ alias] {. expr [[AS] 2 al1jas] 


FROM 七 ab1eref {. tableref...} 
FWHERE search condition] 

[BROUP BY colrname |. Colname...1] 
LHAYING searth condition]: 


| subquery {UNIOM TALLI| INTERSECT [ALL | EXCEPT CALL]Y subquery 


select statement ::= 
subquery [ORDER BY result_column [ASCIDESC] {, result column [ASCIDESC)...1]} 





图 3-1 基本 SQL 子 查询 和 Select 请 名 的 通用 形式 


除了 需要 有 SQL Select 语 句 构 造 查 询 的 能 力 以 人 外， 一 个 关系 数据 库 系 统 还 必须 提供 执行 一 
系列 其 他 运算 和 内 务 外 理 任 务 的 方法 。 在 这 一 章 的 开始 部 分 ,我们 会 学 汪 如 何 执 行 某 些 简单 
的 数据 定义 语 身 ， 比 如 我 们 在 CAP 数 据 库 中 建立 表格 时 所 需 的 SQL Create Table 语 名 的 有 了 腿 形 
式 。 这 类 内 劳 处 理 任 务 通常 由 数据 库 管 理 员 (DBA)? 来 完成 。 我 们 将 大 部 分 由 数据 库 管 理 员 用 
作 数 据 定 六 的 其 他 SQL 语句 推迟 到 第 7 章 讲 述 ， 比 如 创建 数据 视图 的 语句 以 及 对 数据 修改 实施 
完整 性 约束 所 需 的 更 复杂 的 Create Table 语句 形式 。 对 复杂 Select 语 句 的 研究 占据 了 本 章 大 部 
分 的 篇 幅 ， 而 我 们 公 在 3.10 革 中 介绍 SQL 的 其 他 数据 操纵 语 名 (data manipulation statement)。 
有 了 这 些 新 的 语句 ， 我 们 就 能 对 数据 库 中 的 表 进 行 所 有 必要 的 修改 操作 : 对 一 个 表 揪 人 新 的 
行 ， 从 表 中 删除 现 有 的 行 ， 以 及 改变 现 有 行 的 某 些 列 的 值 。 整 个 第 3 章 都 用 来 介绍 能 在 我 们 已 
描述 的 交互 式 环境 中 使 用 的 SQL 语句 。 在 第 5 章 里 ， 我 们 将 考虑 如 何 编写 程序 来 执行 这 些 以 及 
许多 其 他 SQL 语句 。 一 种 在 程序 中 使 用 的 SQL 形式 被 称 做 嵌入 式 SQL ， 它 在 某 种 程度 上 不 同 于 
交互 式 SQL。 

2. SQL 的 历史 一 一 标准 和 产品 语言 

最 早 的 SQL 原 型 是 由 IBM 的 研究 人 员 在 20 世 纪 70 年 代 开 发 的 ， 该 原型 第 命名 为 SEQUEL 
(由 Structured English QUEry Language 的 首 字母 缩写 组 成 )。 许 多 人 仍然 将 在 这 个 原型 之 后 出 
台 的 SQL 语言 发 音 为 “sequel"， 尽 管 根据 ANSI SQL 委员 会 的 规定 ,正式 的 发 音 应 为 : “ess 
eue el 。20 世 纪 80 年 代 早 期 颁布 了 几 个 使 用 SQL 产品 语言 的 关系 数据 库 系 统 产品 ， 而 从 那 时 
起 SQL 开始 成 为 国际 标准 的 数据 库 语 言 ( 尽管 我 们 将 看 到 “标准 ”的 SQEL 是 不 确定 的 )。 在 
SQL 成 为 标准 的 同时 ， 一 些 老 的 语言 也 由 于 支持 它们 的 商用 数据 库 系 统 厂 商 纷纷 引 进 自 己 的 
SQL 产品 语言 而 逐渐 被 废弃 。 尽 管 绝 大 客 数 产品 的 SQL 有 着 极 大 的 相 伺 性 ， 但 它们 之 间 的 一 
系列 差别 可 能 会 使 初学 者 们 感到 迷惑 。 正 因为 这 样 ， 本 书 集 中 介绍 我 们 自己 的 “标准 ”SQL， 
我 们 一 直 称 之 为 基本 SQL( 从 现 有 的 多 种 标准 中 提取 当前 的 目标 语言 )， 然 后 跟踪 一 些 主要 数据 
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库 系 统 产品 与 该 标准 之 间 的 重要 差异 : ORACLE 颁布 了 版 本 8.1.$，INFORMIX 颁 布 了 版 本 9.2. 
DB2 Universal Database 颁 布 了 版 本 6 (我 们 将 这 个 版 本 称 做 DB2 UDB， 以 区 别 于 别 的 版 本 ， 
比如 仅 在 QOS/390 下 运行 的 老 的 DB2 系 统 )。 我 们 偶尔 也 会 涉及 到 其 他 重要 的 产品 ， 如 SYBASE 
和 和 MICROSOFT SQL Server。 与 数据 库 系 统 打 交道 的 读者 很 可 能 正在 使 用 这 些 产 品 中 的 一 个 。 

现在 ,让 我 们 来 进一步 讲述 SQL 慰 准 。 和 目前 ， 被 数据 库 产品 和 教材 引用 的 有 好 儿 种 SQL 
“标准 ”"。 由 美国 国家 标准 局 ( ANSI ) 在 1989 年 采纳 的 规范 被 称 为 SQL-89, 它 被 用 来 取代 更 早 
的 1986 标 准 ， 并 日 此 规范 也 被 国际 标准 化 组 织 (IS 吕 ) 采 纳 。5SQL-86 和 SQL-89 都 失去 了 许多 重 
峰 的 DBA 能 力 并 形成 了 一 种 最 小 的 标准 集 一 一 一 个 绝 大 多 数 关 系数 据 库 产品 在 几 年 前 就 已 经 
能 符 谷 的 普通 标准 。 这 意味 着 对 新 的 产品 特征 缺乏 相应 的 指导 ， 在 开发 的 过 程 中 就 互 不 兼容 
并 缺少 互 操作 性 ( 也 就 是 说 ， 用 SQL 写 一 个 能 在 不 同 数据 库 产品 上 运行 的 程序 已 变 得 很 困难 )。 
X/Open 标准 是 由 一 个 最 初 包 含 了 UNIX SQL 生产 广 商 的 开放 系统 协会 提出 的 ， 它 被 用 来 开发 
ANSISO 标 淮 扩 展 语 法 的 公共 集合 并 允许 SQL 应 用 程序 在 不 同 产品 之 间 有 更 大 的 可 移植 性 

与 此 同时 ，ANSI 和 ISO 的 委员 会 正在 采取 新 的 措施 。 它 们 采用 的 方法 是 跳 过 现 有 的 版 本 
并 为 满足 将 来 的 需求 而 制定 一 种 新 的 SQL 标准 . 这样 -~ 来 ， 生 产儿 商 在 升 发 新 的 产品 功能 时 
就 能 不 为 以 前 发 生 的 不 兼容 性 问题 所 困扰 。 在 发 展 这 种 方法 的 过 程 中 ， 建 议 在 将 来 实现 的 性 
能 被 分 配 到 两 个 不 同 的 修订 本 中 ; SQL2 和 SQL3。 在 1992 年 ，ANSLTISO 和 颁布 了 SOL2 版 本 ， 标 
准 的 名 称 为 SQL-92。3SQL-92 分 成 几 个 顺序 级 别 : 从 代表 SQL-89 最 小 扩展 集 的 “Entry” 到 
“Intermediate” 积 “Full 。 然 而 ， 主 要 的 几 个 数据 库 生 产 厂 商 可 能 永远 不 会 遵守 SQL-92 的 高 
层 部 分 ,这 已 经 是 显而易见 的 事实 。 所 以 ， 一 些 功能 在 实际 情况 下 将 永 证 不 会 被 采纳 。 完 成 于 
1999 年 的 SQL-99 和 修订 本 共有 更 加 高 级 的 特征 〔 包括 对 象 -关系 特性 )。 一 些 数 据 库 产品 甚至 在 
SQL-99 定 稿 以 前 就 已 经 实现 了 符合 该 标准 的 特征 ，SQL-99 据 弃 了 “顺序 级 别 ” 的 概念 而 是 创 
建 了 “Core” 级 别 ， 这 个 级 别 集中 了 大 家 公认 为 重要 的 特征 以 及 生产 厂商 为 了 某 些 特殊 应 用 
而 提 殿 的 其 他 功能 集合 。 

正如 我 们 所 能 见 到 的 那样 ，SQL 标 准 是 不 确定 的 ， 而 “标准 ”一 词 几 乎 失 太 了 它 的 意义 
(尽管 ANSI SQL 标准 委员 会 打算 用 SQL-99 来 取代 SQL-92 并 仔细 考虑 了 SQL-92 到 SOL-99 的 向 
上 兼容 性 )。 在 这 一 章 ， 我 们 将 集中 介绍 SQL-995, 在 相关 的 地 方 还 会 引用 XADpen 标 准 。 我 们 前 
而 已 说 过 ， 庞 大 的 SQL-99 ( 以 及 更 老 的 Full SQL-92 ) 标准 的 一 些 特 征 将 水 还 不 会 被 一 些 生 产 
上 商 实现 ， 而 XAOpen 标 准 却 曾 力 强 调 系统 之 问 的 可 移植 性 ， 因 而 不 会 包 合 不 被 成 员 厂 疝 认 可 
的 特征 。 在 这 …* 章 里 ， 我 们 将 介绍 在 其 些 产品 中 蕊 实现 的 关系 SQL-99 特 征 ， 但 我 们 将 其 中 的 
对 象 - 关 系 特性 放 到 第 4 章 来 讨论 。 本 章 介 绍 基 本 SQL ， 它 包含 了 SQL-92 和 SQL-99 中 已 经 被 我 
们 将 谨 学 到 的 所 有 主 和 要 生产 上 次 实现 了 的 功能 。 第 4 章 将 槛 盖 旦 前 一 些 数据 库 产品 所 支持 的 对 
象 -关系 特征 等 内 容 。 

现在 ， 我 们 来 向 顾 一 下 本 章 所 涉及 的 商用 数据 库 产品 的 简短 历史 。 尽管 绝 天 多 数 最 新 的 
产品 版 本 都 支持 对 象 一 关系 模型 ,但 目前 流行 的 仍然 是 关系 数据 库 。 这 种 情况 在 将 来 可 能 会 
有 所 改变 。 

目前 销售 量 最 大 的 数据 库 产品 是 ORACLE 。 该 产品 以 其 在 不 同 的 平台 之 出 的 可 移植 性 而 
著称 ,但 最 突出 的 应 用 可 能 还 是 在 UNIX 和 Windows NT 系统 上 。 存 1997 年 的 后 期 ，ORACLE 
颁布 的 版 本 8 是 最 早 提供 对 象 -关系 特性 的 版 本 。 

DB2 产 品 最 初 由 TIBM 在 1983 年 颌 布 ， 用 在 IEM 大 型 机 的 MVS 操 作 系 统 上 。IBM 对 关系 模 
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型 的 执着 是 关系 模 殖 胜 过 诸如 IMS 和 IDMS 之 类 的 老 的 前 关系 产品 的 推动 方 。( IMS 仍 然 被 频繁 
地 使 用 着 ， 因 为 有 太 多 的 公司 把 它 作 为 假定 的 系统 结构 来 编写 它们 的 操作 型 数据 处 理 系统 。) 
在 1997 年 , IJBM 发 布 了 一 个 新 的 对 象 -关系 版 本 : DB2 Universal Database, 版 本 5 (DB2 UDB )。 
它 可 以 在 PC 机 和 UNIX 平 台 上 运行 。 现 在 它 也 在 OS/390 上 运行 。 

INFORMIX 是 具有 对 象 - 关 系 特性 的 第 三 大 数据 库 生产 厂商 ， 它 在 1996 年 购买 了 Tliustra 产 
师 。Ilustra 产 品 是 为 推进 对 象 - 关 系 标准 而 特地 开发 的 ， 此 产品 非常 之 成 功 。 

据 历 史记 和 载 ，INGRES 产 品 是 加 州 大 学 伯 克 莱 分 校 在 DEC VAX 和 UNIX 系 统 下 开发 的 ， 并 
及 被 世界 各 地 的 计算 机 科学 系 广泛 地 采用 。 杯 书 的 第 一 版 包含 了 INGRES 的 某 些 细节 ， 但 大 多 
数 大 学 已 转向 使 用 其 他 的 数据 库 系 统 ， 所 以 目前 的 版 本 不 再 包 人 沼 这 部 分 内 容 。 

我 们 刚才 担 到 的 每 个 产品 都 有 许多 版 本 ， 因 为 大 约 每 年 都 会 出 志 一 个 新 的 版 本 。 而 皇 ， 
从 目前 的 情况 来 看 一 个 版 本 和 下 一 个 版 本 之 间 的 差别 还 是 相当 明显 的 。 在 本 书 中 我 们 将 涉 玉 
ORACLE 版 本 8.1.5【 对 象 -关系 版 本 )、INEORMIX Dynamic Server 《INFOMIX ) 版 本 9.2 以 
及 DB2 Universal Database(DB2 UDB) 版 本 6。 一 般 说 米 ， 所 有 数据 库 产品 的 版 本 都 具有 “向 上 
兼容 性 ”， 这 意味 着 后 来 的 版 本 可 能 提供 新 的 特征 但 庶 该 还 支持 早期 版 本 的 所 有 特征 。 这 样 ， 
本 书 抑 肉 容 对 上 述 所 有 产品 后 来 的 版 本 应 该 也 是 适用 的 。 

从 所 有 这 些 对 新 数据 库 横 型 和 未 颁布 标准 的 讨论 以 及 主要 数据 库 产品 从 一 个 版 本 到 另 一 
个 版 木 的 重大 变化 来 看 ， 你 可 能 会 认为 数据 库 系统 往往 处 于 一 种 变化 不 定 的 状态 。 这 的 确 是 
事实 。 尽 管 在 从 创始 到 现在 的 近 40 年 里 数据 库 领 域 里 取得 了 巨大 的 进步 但 我 们 旦 前 却 处 在 
一 个 自 17 世 纪 科 学 方法 论 的 首次 提出 以 来 还 未 曾 在 某 个 更 加 成 熟 的 科学 学 科 中 出 现 过 的 发 展 
阶段 上 。 当 前 数据 库 系 统 的 许多 重要 原理 必 将 长 久 地 保持 其 有 效 性 ， 但 我 们 仍然 有 希望 看 到 
在 接 下 来 几 年 早 发 生 的 重大 变化 。 在 本 书 中 ， 我 们 强调 基本 的 原理 并 指出 它们 在 当前 软件 实 
践 中 的 局 限 性 。 


3.2 创建 数据 库 


在 这 一 节 的 末尾 ， 练 习 3.2.1 给 出 了 一 个 以 本 节 和 附录 六 介绍 的 SQL 数 据 定义 语句 为 基础 的 
上 机 作业 。 该 练习 会 让 你 创建 一 些 数据 库 表 来 复制 图 2-2 的 三 客 -代理 商 - 产 品 数据 库 〈《CAP 数 
据 库 )。 以 后 的 上 机 作业 会 假定 这 个 数据 库 已 存在 并 让 你 用 SQL 数据 操纵 语句 来 检索 和 修改 这 
些 表 中 的 数据 。 

首先 ,你 需要 得 到 计算 机 系统 的 一 个 账号 一 一 登录 到 计算 机 的 用 户 ID 和 密码 一 一 以 及 能 使 
你 进入 数据 库 系 统 的 数据 库 系 统 自 身 的 一 个 独立 账号 。 你 的 指导 老师 会 告诉 你 如 何 得 到 这 两 
个 账号 。 一 旦 得 到 了 这 些 账号 ， 附 录 A 的 教程 会 教 体 一 些 在 DRACLE 和 INFORMIX 数 据 库 系 
统 牛 所 需 的 与 产品 相关 的 基本 技能 。 这 些 教程 涉及 到 的 技能 包括 如 何 从 把 作 系 统 进 人 数据 库 
系统 ， 如 何在 数据 库 中 建立 表 或 删除 表 ， 如 何 将 在 操作 系统 文件 中 的 数据 导 人 一 个 已 定义 的 
数据 库 表 中 ， 以 及 奶 何 交互 地 执行 SQL 命令 。 为 进入 ORACLE 而 键 人 sqlplus( 所 有 的 都 是 小 写 
字母 或 者 为 进入 INFORMIX 而 键入 dbaccess 都 会 使 你 进入 一 个 交互 环境 ， 在 这 个 环境 中 你 可 
以 用 许多 命令 来 编写 SQL 语句 ， 对 它们 进行 编辑 ， 将 它们 保存 到 操作 系统 的 文件 中 并 在 以 后 
把 它们 从 文件 中 读 回 ， 将 它们 提交 给 数据 库 系统 执行 ; 等 等 。 

为 了 在 ORACLE 系统 中 建立 属于 CAP 数 据 库 的 CUSTOMERS 表 ( 我 们 采用 小 写 的 表 和 名 以 区 
分 SQL 和 关系 代数 )， 你 需要 进 和 信安 互 环境 并 键入 以 下 SQIL 谷 令 : 
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13.2.1} SaL > create table customars tcid chartda) not nul1, 
2 tname varchartl3), city varchartzd)y, discnt real, 
3 primary keytectd)}y: 


注意 ， 在 第 一 行 输入 回 车 后 ，ORACLE SQL* Plus 环境 会 为 第 一 行 打印 出 一 个 提示 符 2。 
第 三 行 的 提示 符 是 3， 依 此 类 推 。 可 键 人 的 行 的 数目 是 设 有 限制 的 .在 用 一 个 分 导 【; ) 结束 
一 行 以 前 ， 系 统 不 会 试图 解释 你 已 编写 的 代码 。 所 有 的 SQL 语句 都 用 分 号 来 表示 结束 。 

此 Creare Table 语 句 将 学 致 一 个 名 为 customers 的 空 表 的 建立 。 上 表 的 出 名 分 别 为 ciq， 
cname，city 和 aiscnt。 主键 只 包含 了 单独 的 -- 列 : cia 。 在 每 个 指定 的 属性 名 后 面 紧 跟 
着 每 个 属性 的 的 类 型 {type) 或 数据 类 型 【datatype )《 即 第 2 章 中 讨论 的 属性 的 域 (domain ) )。 
困 此 ，cname 的 类 型 为 varchar(13)【 - -个 最 大 长 度 为 13 个 宁 符 的 可 灾 长 字符 串 )， 面 aiscnt 
的 类 型 为 teal (ANSI 数据 类 型 ， 代 表 4 个 字 节 的 实数 ， 相 当 于 C 语 语 里 的 float 型 )。 附录 AA 的 
A.3 节 包含 了 在 征文 列 时 可 以 使 用 的 洗 多 其 他 可 能 的 数据 类 型 。 在 cidq 列 的 名 学 和 类 型 之 后 的 
not null 子 名 意味 着 在 该 列 上 不 能 出 现 空 值 ;， 任何 会 导致 该 列 出 现 空 值 的 SQL 数据 提 纵 语句 都 
会 失败 ， 并 发 给 用 户 一 个 警告 信息 。 同 顾 2.4 节 ， 我 们 知道 一 个 空 值 代表 一 个 未 定 多 的 或 不 适 
用 的 值 。 亿 是 由 十 DBA 决 定 将 cid 列 作为 每 一 行 唯一 的 标识 【 表 的 键 )， 所 以 在 这 - : 列 上 不 多 
许 出 现 空 值 ， 与 NOT NULL 子 人 到 类 似 ，Create Tabls 语 句 的 许多 其 他 子 名 可 以 被 用 来 确保 附加 
的 数据 完整 性 。 不过， 在 讲 下 一 章 以 前 我 们 还 不 需要 Create Table 语 名 的 全 部 动能 。 现 在 为 了 
定义 CAP 数 据 库 中 的 表 ， 我 们 在 图 3-2 中 给 出 Create Table 命 令 的 有 限 形式 。 


CREATE TABLE tablename (colname datatype [NOT NULL} 
{, colname datatype ENOT NULL}I ...] 


EL, PRIMARY KEY ftcolname 1{, colname ...1}1]}: 





图 3-2 ”Create Table 语 名 的 有 限 形 式 


1. 标准 格式 约定 

注意 图 3-1 逢 13-2 的 SQL 语 名 形式 。 其 中 大 写 的 项 必须 完全 按照 图 中 所 写 的 那样 键入 【除非 
在 特定 的 例子 里 大 写 的 项 被 正常 地 转化 成 小 号 。 人 例如， 基于 图 3-2 形 式 的 语句 [3.2.11)。 这 些 鸽 
名 形式 中 的 小 写 项 ， 比 如 图 3-2 中 的 tabplename ,代表 了 由 用 户 选 择 和 命名 的 项 。 这 样 ， 以 图 
3-2 这 种 形式 出 现 的 每 条 命令 都 以 create table 打 头 ， 而 fablename 并 不 被 逐 字 照搬 地 输 
入 而 是 应 该 填 和 用户 希望 创建 的 表 名 ， 比 如 customers。 

还 有 许多 SQL 语 句 不 会 用 到 的 特 萄 字符 ， 包 括 左 右 花 括号 和 、 左 厂 方 括号 1 ] 以 及 紧 杠 1。 
由 二 这些 字符 从 不 出 现在 SQL 语 名 中 ， 所 以 我 科 可 以 在 SQL 的 语句 形式 中 使 用 它们 ,与 省 略 
号 …( 在 同一 行 上 的 三 个 名 号 ) 一 起 米 说 明 SQL 的 合法 特征 。 

问 顾 出 现在 语句 形式 中 的 在 上 述 字 符 序 列 之 外 的 所 有 特殊 字符 ， 特 别 是 译 号 和 图 括号 ， 
它们 必须 完全 按照 语句 形式 中 所 写 的 那样 键入 并 且 没 有 书写 格式 上 的 特殊 合 义 。 这 样 在 图 3-2 
中 ,在 Lablename 后 面 的 是 -- 个 左 阅 括 号 ， 之 后 紧 跟 着 用 如 导 分 隔 的 列 定 义 ， 然 后 十 一 个 关 
站 的 右 贺 括号。- :个 圾 中 可 征 定 义 的 列 的 确切 数 具 有 一 个 视 系 统 而 定 的 上 限 ， 但 我 们 在 这 些 
SQL 语句 形式 中 并 不 考虑 这 项 限制 。 

当 一 个 短语 出 现在 方 括号 [ ] 里 面 的 时 候 ， 该 短语 是 可 选 的 。 因 此 ， 我 们 发 现 图 3-2 中 的 短 
语 NOTNULIL 在 列 和 名 和 数据 类 型 描述 之 后 可 以 出 现 也 可 以 不 出 瑞 。 同 样 ， 对 二 键 的 年 父 也 是 可 
选 的 ， 而 且 一 个 主键 可 以 由 一 列 或 多 列 组 成 。 诸 名 13.2.1] 可 以 视 为 图 3-2 语 句 形式 的 一 个 例子 。 
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坚 杠 钊 被 用 来 表示 在 许 允 可 能 的 短 声 之 间 的 一 种 选择 。 当 其 中 有 且 只 有 一 个 短语 必 织 出 
现时 ， 该 选择 可 以 是 强制 的 ,在 那 种 情况 下 ， 语 法 形式 为 (假定 有 三 种 选择 ): 选择 1 选择 2 
选择 3 或 者 {选择 1! 选 择 2Il 选 择 3}( 用 花 括号 来 对 选择 “分 组 ” )。 在 第 二 种 写法 中 ， 花 括号 被 用 
来 指明 选择 从 哪里 开始 以 及 到 哪里 结束 。 例 如 ， 形 式 

terml term2? | term3 
是 有 歧 六 的 。 我 们 是 给 出 了 -… 个 在 terml erm2 和 term3 之 间 的 选择 吗 ? 选 项 之 则 的 选择 是 
从 哪里 开始 的 ?注意 当 我 们 换 一 种 号 法 时 此 问题 是 起 样 消失 的 : 

terml fterm? | term3! 

这 种 形式 意味 着 我 们 可 以 先 与 Lerml，、， 然 厨 “分 组 ”形式 中 的 花 括 号 提供 了 term2 利 term3 
之 间 的 --- 个 选择 。 因 此 ，terml term3 就 是 可 能 出 现 的 短语 。 

闭合 花 括 导 的 这 种 “分 组 ”用 法 不 是 图 3-2 所 用 的 形式 。 在 那里 我 们 使 用 了 约定俗成 的 号 法 ; 
将 短语 放 人 入 花 括 导 并 以 省 略 号 结尾 。 比 如 ， 图 3-2 的 最 后 - - 行 {，colname.,.,.} 说 明 该 短语 ( 初 
始 的 有 逗 导 和 一 些 选 用 的 列 名 ) 在 实际 应 用 中 可 能 出 现 零 次 或 多 次 ， 这 意味 着 图 3-2 的 语法 要 求 一 
个 表 有 一 个 或 多 个 列 定义 ， 因 为 我 们 看 到 短语 colname datatype [NOT NULL] 先 出 现 了 一 
次 ， 然 后 又 在 花 插 号 里 出 现 了 -一次 ， 并 和 且 以 作为 分 隔 符 的 皖 号 打头 ， 后 面 还 跟着 省 略 号 。 

坚 杠 也 能 在 方 插 号 内 使 用 ， 此 时 可 选择 由 坚 杠 分 也 的 短语 中 的 一 个 ,但 整个 短语 是 可 选 
的 (也 就 且说 可 能 没有 短语 出 现 }，、 如 果 在 这 种 情况 下 其 中 的 一 个 短语 还 被 加 了 下 划 线 ,这 意 
味 着 缺 省 的 选择 为 加 下 划 线 的 短 鸽 。 作 为 一 个 例 半 ， 我 们 看 一 下 图 3-1, 它 的 开 涉 -- 行 为 ; 

SELECT [ALL | DISTINCT] select_1ist 

这 里 的 ALL 说 明 查 询 得 到 的 所 有 行 都 将 被 放 入 结果 表 ( 即使 有 重复 的 行 )， 而 DISTINCT 
说 明 重 复 的 行 不 会 被 放 入 结果 表 。 如 果 在 [ALL ! DISTINCT] 中 没有 做 出 选择 ， 缺 省 的 选择 
是 ALL， 即 允许 出 现 重复 行 。 

2. 实践 练习 

如 果 你 所 用 的 数据 库 产 品 是 ORACLE 或 INFORMIX ， 那 可 以 读 - 下 附录 A， 那 里 有 一 个 关 
于 建立 CAP 数 据 库 所 需 技能 的 教程 。 即 使 你 正在 使 用 一 个 不 同 的 产品 ， 附 录 态 也 会 提供 一 些 必 
要 的 技能 以 及 相对 标准 的 Create Table 命 令 。( 作者 以 后 可 能 会 在 本 书 的 主页 上 提供 其 他 产品 的 
教程 ， 网 址 为 httpyfiwww.cs.nmb.edu/~poneilidbppp.html。 ) 

练习 3.2.1 ”在读 完 附录 A 对 ORACLE 和 INFOQRMIX 的 使 用 说 明 后 ， 如 果 还 没有 人 为 你 建 
立 一 个 数据 库 ， 那 就 用 登录 的 ID 的 前 六 个 字符 (如 peneil1) 作 为 dpname 来 创建 一 个 数据 库 。 
接着 ,为 该 数据 库 建 立 如 图 2-2 所 示 的 表 一 一 customers, agents,， products 和 和 orders。 
你 应 使 用 廊 幕 命令 建立 命令 过 程 文件 以 便 贱 尽 可 能 多 的 工作 。 比 如 : 看 一 下 附录 A.1 对 
DORACLE 的 说 明 中 给 出 的 cust .etl1 的 形式 ， 并 试 着 用 文件 名 agents.ct1，Procds .ctl1 和 
oraers.ecti 重 复 这 一 过 程 以 建立 其 他 的 CAP 表 。 然 后 在 数据 文件 一 一 casts,dac， 
agents.dat, prods .dat 和 ordexrs.dqat 一 一 中 输 和 人 数据 以 便 在 导 人 数据 时 使 用 ， 接 者 再 
给 出 建立 和 导 信 表 的 命令 。 在 建立 了 文件 并 将 它们 导入 数据 库 之 后 ， 用 适当 的 数据 库 合 令 来 
显示 所 有 的 表 在 数据 库 中 的 布局 ， 然 后 用 Select 语句 来 显示 每 个 表 的 内 容 。 


3.3 简单 的 Select 语 各 
SQL 是 用 SeIeet 语 句 来 完成 查询 的 。Select 语 名 的 通用 形式 相当 复杂 ， 在 接 下 来 的 几 节 里 
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我 们 要 对 该 二 名 的 特征 做 出 说 明 。 这 一 站 将 介绍 SQL 查询 的 一 些 最 基本 的 特征， 这 些 特 征 对 
应 于 关系 代数 的 选择 、 投 影 和 笛 卡 儿 积 运算 。 在 关系 代数 运算 的 情况 下 ，Select 语 名 查询 的 绪 
朵 本 号 就 是 一 张 表 。 我 们 也 会 简要 地 介绍 一 下 一 个 简单 的 Seleet 语 名 是 如 何 被 数据 库 系 统 当 作 
访问 计划 来 实现 的 。 访 问 计 划 是 一 个 对 用 户 透 明 的 循环 程序 ， 它 访问 对 计算 机 上 的 数据 库 进 
行 查 启 时 所 需 的 数据 并 产生 期 望 的 结果 。 


例 3.3.1 找 出 住 在 纽约 的 代理 商 的 aid 值 和 名 字 。 

在 关系 代数 中 这 个 查询 可 表示 成 : 

(ABENTS where tity 一 “Mem York [aid，aname] 

为 了 在 SQL 中 解决 同样 的 问题 并 显示 被 检索 的 行 ， 我 们 用 语句 : 

seTect atd, aname From agents where city 一 “Mew York’.: 

该 语句 中 的 保留 字 【 即 在 所 有 SQL Select 语 句 中 都 会 出 现 的 字 ) 是 SELECT、FROM 和 
WHEREBE。 为 了 执行 这 个 Select 语 句 ，3SQL 解 释 器 从 跟 在 FROM 后 面 的 表 开 始 ， 首 先 执 行 WHERE 
后 面 指定 的 选择 条 件 ， 然 后 提取 出 SELECT 后 面 的 字段 名 定 六 的 投影 (我们 称 之 为 选择 列表 )。 
注意 ， 表 的 名 宁 是 用 小 与 子 符 来 指定 的 【因为 它们 在 Create Table 命 令 中 是 那样 被 定义 的 )， 而 
常 晤 'New York' 则 要 用 单 引导 围 起 来 。( 在 一 些 数据 库 产品 中 也 可 以 用 双 引 号 ， 但 是 单 引 与 总 


是 可 接受 的 而 且 是 被 推荐 的 标准 的 一 部 分 。) 图 
例 3.3.2 在 附录 六 中 有 一 个 Select 语 句 的 例子 ， 它 显示 CUSTOMERS 表 中 每 一 行 的 所 有 字 
段 值 以 检查 数据 是 否 被 正确 地 导 人 了 表 中 : 


select < from customers: 

选择 列表 中 的 符号 “*” 是 一 个 表示 检索 所 有 字段 的 简写 符号 。 也 就 是 说 ， 在 这 种 情况 下 
没有 对 字段 的 有 限 集 合 进行 投影 。 而 有 卫 ， 在 这 种 情况 下 所 有 的 行 都 会 被 打印 出 来 ， 因 为 没有 
选择 条 件 的 限制 (WHERE 子 句 没 有 出 现 )。 加 

Select 语 句 不 会 自动 副 除 结果 中 的 重复 行 ， 如 果 要 求 结果 中 不 出现 重复 行 ， 必 须 明确 地 要 
求 这 项 服务 

例 3.3.3 检索 订货 记录 中 所 有 零件 的 pid 值 。 如 果 我 们 提交 以 下 的 查询 ; 


splect pid from orders; 


结果 中 会 有 大 量 重 复 的 bia 值 ， 每 个 值 分 别 对 应 于 图 2-2 中 orders 表 中 相应 的 pig 所 在 的 
行 。 例如，p91 会 出 现 五 次 ， 因 为 它 分 别 出 现 在 orders 表 中 crdno 值 为 1011，1012，1021， 
1016，1024 的 行 中 。 为 了 确保 结果 中 的 每 一 行 的 唯一 性 ， 我 们 需要 给 出 以 下 的 查询 : 

select distinet pid from orders: 

注意 ,保留 宁 distinct 实 际 上 确保 了 检索 后 的 每 一 行 是 唯一 的 。 这 种 唯 -- 性 是 相对 其 他 行 
而 言 的 ; 也 就 是 说 ， 如 果 提 交 如 下 查询 : 

select distinct aid, pid from orders: 

仅 确 保 了 {piad， aig) 这 一 对 值 的 唯一 性 而 没有 保证 piad 值 的 唯一 性 。 这 样 ， 尽管 (a01， 
p01) 会 出 现在 orders 表 中 ordno 秆 为 1011，1012，1016 的 行 中 ， 在 结果 中 却 只 会 出 现 一 次 。 国 

Select 语 句 在 关键 词 DISTINCT 没 有 出 现 的 时 候 允 许 出 现 重 复 的 结果 行 ; 这 意味 着 人 缺 省 的 
情况 是 不 遵守 关系 规则 3 一 一 行 唯一 性 规则 的 。 上 毕竟， 去 除 重复 的 行 需要 额外 的 开销 而 且 会 学 
致 实际 信息 的 丢失 ， 因 为 在 例 3.3.3 的 第 一 个 Seleect 语 句 中 bida 值 p01 出 现 五 次 可 能 正 是 用 户 感 
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兴趣 的 信息 。 
如 果 我 们 想 要 强调 所 有 的 结果 行 都 要 打印 出 来 ， 即 重复 的 行 不 要 被 去 掉 ， 我 们 可 以 通过 
在 选择 列表 前 使 用 保留 字 ALL 来 素 达 与 DISTINCT 相 反 的 意思 。 


select all pid from orders: 


由 于 ALL 是 缺 省 的 选择 ， 所 以 我 们 不 需要 特地 输入 ， 除 非 是 为 了 更 好 的 可 读 性 。 注 意 ， 
这 种 标准 的 SQL 行为 是 怎样 提供 一 种 不 符合 2.3 节 的 关系 规则 3 的 情况 的 ， 因 为 在 结果 中 出 现 的 
行 可 能 是 不 唯一 的 。 

例 3.3.4 写 一 个 关系 代数 表达 式 来 检索 所 有 满足 以 下 条 件 的 顾客 -代理 商 姓 名 对 (cname， 
aname), 其 中 的 顾客 cname 通 过 代理 商 aname 订 了 货 、 我 们 更 涉及 的 表 为 CUSTOMERS、 
ORDERS 和 aAGENTS, 因 为 列 cname 在 CUSTCMERS 表 中 ， 列 aname 人 在 AGENTS 表 中 ， 而 ORDERS 
表 则 跟踪 所 有 的 汀 贷 记录 。 在 关系 代数 中 我 们 可 以 用 下 列表 达 式 来 解决 这 个 查询 问题 ， 

(tCUSTOMERSLcid, chame] “3 ORDERSY bd AGENTS [ename,. aname] 

在 关系 代数 中 很 重要 的 -- 点 是 要 把 CUSTOMERS 表 投影 到 列 [cida，cname] 上 以 去 掉 cicy 
这 一 到 ， 因 为 我 们 并 不 要 求 (CUSTOMERS mw ORDERS) 和 AGENTS 之 间 要 连接 的 行 具 有 相同 的 
city 值 。 另 一 种 方法 是 ， 我 们 用 关系 代数 的 笛 卡 儿 积 运算 而 不 用 连接 运算 : 


{ECLUSTOMERS x ORGERS} x AGENTS}Y where CUSTOMERS. cid = ORDERS.cid 
and DRDERS.aid = AGENTS .aid}[tnaime, name] 


在 这 种 做 第 卡 儿 积 的 方法 中 ,我 们 通过 明 风 指 定 值 必须 相等 的 列 来 限定 要 选择 的 行 ， 这 
在 连接 中 是 自动 发 生 的 。 在 SQL 中 执行 该 查询 的 正规 方法 为 : 


Select uistinct customers. chame. a3gents .aname 
from customers, Orders, agents 
where customers.cid = orders.tid and orders.aid = 3gents.a1d: 


SQL Select 语 句 的 语法 与 上 述 两 个 关系 代数 解法 中 的 第 卡 儿 积 形 式 是 等 价 的 。Select 语 各 
导致 了 以 下 玫 个 (概念 性 的 ) 步 又 : 

1) 计算 出 现在 FROM 后 面 的 表 之 间 的 笛 卡 儿 积 (这 被 认为 是 Select 语 句 中 的 FROM 子 科 加 

2) 实施 由 WHERE 后 面 的 条 件 规定 的 选择 操作 { WHERE 子 条 )， 

3) 将 出 现在 选择 列表 中 的 属性 投影 成 结 采 表 。 在 这 里 ， 我 们 看 到 当 涉 肥 到 多 个 表 的 时 候 ， 
SQL 也 具有 使 用 限定 的 属性 名 的 能 力 ， 比 如 CUSTOMERS .cid。 然 而 ，SQL 标 准 认为 在 诸如 
此 类 的 关系 查询 中 ， 当 列 名 仅 在 其 中 的 一 个 表 中 出 现时 它 就 不 必 受到 限定 。 这 样 ， 取 代 上 面 
第 一 行 的 写法 

select distinct customers.cname, agents.aname . . - 

我 们 可 以 写成 

splect distinct cname,. aname . , | 

SQL-99 和 Full SQL-92 标 准 规定 了 在 SQL Select 语 名 的 FROM 子 句 中 执行 的 是 连接 运算 
【参见 3.6 节 })， 但 这 种 特性 在 大 多 数 商 用 产品 中 还 未 得 到 突现。 在 没有 这 种 功能 的 情况 下 ， 就 
必须 通过 进行 笛 卡 儿 积 运算 ( 在 FROM 子 名 中 写 一 个 由 逗号 分 陪 的 参与 笛 卡 儿 积 运 算 的 家 序 
列 ) 并 且 在 WHERE 子 名 中 包 会 表示 参与 连接 的 列 的 值 相等 的 特定 条 件 来 模拟 连接 运算 。 

我 们 还 可 雇 写 ~- 个 能 完成 算术 运算 的 Select 查 询 语句 并 且 打 印 出 选择 列表 中 各 列 的 结果 值 。 
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例 3.3.5 在 orders 表 的 基础 上 站 成 含有 到 ordno, cid, aid, pid 和 profit 的 “ 表 ”， 
其 中 的 prof it 是 由 quantity 和 上 售 出 商品 的 price 计 算 而 得 ,方法 是 全 部 销售 收入 减 去 560 免 
的 销 上 信 收 入、 顾客 的 折扣 以 及 代理 商 的 贿 金 白 分 率 . 
splect ordnp, x.cid, x.aid, x.pid, 
-Dt pp. Pricey 一 Dl*ic.discnt + a.percent) * (x.qty*p,.pricey} 
from orders as X, customers as cc, agents as DF, products 3s op 
where ceid = Ci ah 和 a.aid = x,aid and ppid = Xi: 


注意 字母 x，c<，a 种 p 分 别 与 orders，customers，agents 种 products 表 相对 应 ， 因 为 它们 
在 FROM 子 句 中 被 定义 为 表 别 名 。 相 类 似 的 ， 在 关系 代数 中 别名 是 通过 书写 := orders,， 
:=customers, a:=agents, p:=products 来 建立 的 。 骨 别名 在 Select 语 种 中 是 通过 在 表 名 后 面 
紧 跟 可 选 关键 词 AS 以 及 所 希望 的 则 名 中间 不 加 逗号 ) 来 定义 的 。 吝 号 被 用 来 指明 后 而 女 的 是 一 个 
新 的 表 名 。 注 意 如 果 关 键 词 AS 被 省 略 了，SQL 仍 能 识别 出 表 别 名 ， 因 为 在 表 名 和 表 别 名 这 两 个 标识 
符 中 间 没 有 这 号 分 隔 。 一 个 表 别 名 仅 在 定义 它 的 Select 次 句 的 上 下 文中 与 该 表 相 联系 ; 因此 ， 相 同 的 
别名 可 以 因 不 司 的 用 途 而 在 不 同 的 Select 计 名 中 被 定义 。 在 该 查询 中 使 用 表 别 名 是 为 了 为 列 名 建立 一 
个 较 短 的 限定 形式 。 为 了 便于 理解 ， 我 们 在 这 个 Select 语 柯 中 使 用 了 限定 的 列 名 : x. qty, p.price, 
ceaiscent 以 及 a,percent， 尽 管 这 些 独一无二 的 列 名 并 不 严格 地 需要 与 成 限定 的 形式 。 

此 查询 的 选择 列表 说 明了 一 -个 重要 的 特征 ， 邑 我 们 能 计算 由 常数 项 (比如 .01) 或 来 自 当 
前 连接 行 ( 比如 p .price) 的 不 同 列 值 组 成 的 表达 式 的 值 。SQL 支 持 标 准 运 算 符 (+, -, *, 让， 
我 们 也 可 以 使 用 标 基 函数 ， 比 如 mod(n, b) (= 被 5 除 时 得 到 的 余数 )]， 以 及 诸如 lowerfc)【 它 返 
回 由 所 有 从 c 中 字符 转化 而 来 的 小 写字 符 组 成 的 char 型 变量 ) 之 类 的 字符 申 也 数 都 在 ORACLE, 
DB2 UDB 和 INFORMIX 中 有 所 规定 ， 但 这 些 并 不 是 标准 的 一 部 分 【除了 Full SQL-99 文 持 abst ) 
和 meodt ) )。 有 关 这 类 表达 式 的 详细 介绍 在 3.9 节 给 出 。 注 意 这 里 有 隐 式 类 型 转换 ， 所 以 
c,digcnt {float 型 】 和 a .percent (interger 型 ) 相 加 能 得 到 float 型 的 结果 计算 后 的 表达 
式 的 值 没有 -一 个 明确 定义 的 列 名 ， 而 不 同 的 产品 在 为 需 计 算 的 列 命名 时 使 用 的 方法 是 不 同 的 。 
在 ORACLE 中 ， 此 查询 得 到 如 下 结果 。 


01x.atr "bP Pricel 一 
小 17 她， sent 于 -eT 
“gy 六 -Price) 
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对 于 例 3.3.5 使 用 的 表 别 名 x，c，a 和 P， 不 同 的 商用 数据 库 广 品 使 用 了 亦 冤 不 同 的 称 时 。 
ORACLE 和 INFORMIX 使 用 的 术语 是 别名 咕 表 别名 ， 该 术语 出 现在 这 些 产 品 的 所 有 帮助 文件 
中 。DB2 UDB 和 ANSI SQL 标 准 使 用 术语 相关 名 。 范 转变 量 或 元 组 变量 偶尔 也 会 被 使 用 ， 原 
四 在 后 面 解释 .如 果 你 想 轻松 地 阅览 各 种 商用 数据 库 产 品 提 供 的 指南 ， 这 类 术语 是 很 重要 的 。 
例如 ， 在 《ORACLE Sever SQL Language Reference aaa 几 (gORACLE 服 务 器 SQL 请 言 和 参 
考 手册 》) 中 ， 术 语 别 名 、 表 被 列 在 索引 中 ， 而 术语 相关 名 承 找 不 到 ; 在 《INFORMIX Guide 
To SQL Syntax》(《INFORMIX SQL 诸 法 指南 3》) 中 ， 别 名 是 标准 的 说 法 ; 而 《DB82 Universal 
Database SQL Reference } ( 《DB2 Universal Database SQL 参考 和 ) 使 用 的 则 是 相关 名 这 个 术语 ， 
而 术语 别名 ， 即 便 是 出 现 ， 指 的 也 是 另 一 个 语法 元 素 。 

关于 秽 3.3.5 中 代表 利润 的 列表 达 式 的 列 名 显示 问题 ， 不 同 的 商用 数据 库 产 品 采 用 了 众多 
不 同 的 方法 。 在 这 种 情况 下 ,不 存在 可 从 表 中 直接 得 来 的 简单 列 名 。 不 同 的 商用 数据 库 系统 
产品 在 这 一 问题 上 存在 着 差别 是 因为 早期 的 标准 没有 定义 统一 的 方法 。 人 龙 ODRACLE 中 ， 符 号 
表达 式 的 完整 文本 将 被 复制 并 被 用 作 列 和 名， 这 就 像 我 们 在 例 3.3.5 的 结果 表 中 见 到 的 那样 。 从 
SQL-92 标 准 开 始 ， 用 户 就 可 以 为 Select 语 名 中 的 表达 式 列 提供 一 个 即席 名 称 。 在 ANSI SQL 标 
准 文 档 中 ， 它 被 称 做 列 名 字 { 表 明 它 将 成 为 绪 果 的 列 名 ); 在 OQRACLE 中 人 它 被 称 为 列 别 名 ,以 区 
别 于 我 们 已 抑 过 的 表 别 名 ; 在 INFORMHX 中 它 被 称 做 显示 标 葡 :; 而 在 DB2 UDB 中 ， 它 被 简单 
地 称 做 “在 Select 语 名 中 的 一 个 列 和 名”( 基本 上 是 遵从 ANSI SQL 标准 )。 在 DRACLE 里 ， 我 们 
可 以 通过 书写 

Se1etct，。，，Rxpr [Eas] c alias]，。 ，， 

在 选择 列表 中 给 出 表达 式 expr 所 代表 的 列 的 名 字 c_alias。 目 前 ， 所 有 的 主要 数据 库 产品 都 允 
许 为 这 样 一 个 经 过 计算 而 得 来 的 列 重 新 命名 。 比 如 在 ORACLE 中 ， 我 们 可 以 将 例 3.3.5 的 查 
询 写 成 : 

select distinct x.ordno, x.cid, x.aid, x.pid,. .40*(xX.qty*p.price) 

—.01*(tc.discnt + a.percent}* x. qty*p.price}y as profit -- Folurmnm alflas 


from orders x, customers tt, agents a, products p 
Where cc.cid = x.cid and a.aid = x.aid and p.pid = x.pid; 


以 建立 一 个 有 如 下 表 头 的 表 。 


xiordnoe [etd | x.atd | xpid | prorit 


注意 ， 在 任 一 SQL 语句 行 中 ， 我 们 都 能 使 用 两 个 连续 的 连 字 符 以 表明 跟 在 连 字 符 后 面 的 
文本 是 注释 。 

例 3.3.6 ” 求 出 住 在 同一 城市 的 所 有 顾客 对 。 在 关系 代数 中 ， 为 解 出 该 查询 的 结果 ， 我 们 
会 从 计算 cusTOMERS 表 的 两 个 副本 的 笛 卡 儿 积 开 始 ， 然 后 使 用 一 个 适当 的 选择 条 件 : 


Cl := CUSTOMERS. C2 := CUSTOMERS 
tel x C2 Where Cl.eity = C2.city and Cl.ceid ¢ C2.cid 


我 们 需要 用 两 个 不 同 的 名 字 来 标识 CUSTOMERS 表 : Cl1 和 和 Cc2。 这 样 ， 笛 卡 儿 积 中 的 列 将 
受到 唯一 的 限定 。 正 如 我 们 在 例 2.7.3 中 见 到 的 那样 ， 限 制 条 件 C1 .ciq <c2 .cid 使 我们 去 掉 
了 元 余 的 顾客 对 { 妈 由 局 一 顾客 组 成 的 对 ,或 是 由 不 同 顾 客 组 成 的 等 价 对 出 现 了 两 次 )。 在 
SQL 中 ， 该 查询 可 用 如 下 Select 语 句 来 执行 : 


select cl.cid, ce .cid 
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froem customers cl, customers c? 
where cl.city = ceity and cl.cid < ec2.cid: 


储 这 个 SQL 查 询 的 例子 里 ， 为 了 考虑 由 同一 表 中 的 行 组 成 的 行 对 ， 表 别名 是 必需 的 。 如 
此 没有 这 样 的 别名 ， 我 们 就 不 能 对 笛 卡 儿 积 里 名 字 相 同 的 列 进行 限定 。 注 意 天 写 的 表 别 名 Ci 
和 C2 在 SQL 中 也 完全 能 被 接受 ; 们 在 一 般 的 情况 下 我 们 仍 使 用 小 写 的 和 名字。 在 SQL 标准 中 名 
字 C1 和 c1 是 等 价 的 (大 小 写 无 关 )。 国 

正如 例 3.3.4 中 提 到 的 那样 ,求解 例 3.3.6 的 Select 语 句 的 概念 性 步骤 如 下 : 首先，FROM 子 
全 将 表 c1 和 c2 等 价 十 customers 表 并 做 它们 的 向 卡 儿 积 ， 然后 ，WHERE 子 旬 限 定 了 要 从 第 
上 儿 积 中 选取 的 行 集 ; 最 后 ， 从 这 个 行 集中 获得 的 值 被 投影 到 选择 列表 上 ， 这 为 我 们 展示 了 
一 个 正确 的 概念 性 求解 顺序 ， 但 如 果 这 就 基数 据 库 系 统 在 回答 我 们 的 查询 时 所 实际 遵循 的 过 
程 ， 那 就 有 些 惊 人 了 。 为 了 引出 一 个 被 称 做 查询 优化 的 研究 领域 ， 我 们 介绍 --- 种 被 称 为 访问 
计划 的 不 同 算 沙 ,这 是 数据 库 系统 在 实际 检索 查询 数据 时 会 采用 的 - -种 方法 。 此 方法 也 说 明了 
一 种 不 同 的 有 助 于 我 们 描述 求解 过 程 的 概念 性 观点 。 我 们 从 表 别 名 c1 和 c2 开 始 考 虑 ， 因 为 它 
们 是 出 现在 FROM 子 句 中 的 范围 变量 ， 即 载 有 customezrs 表 的 行 位 置 值 的 变量 。 在 骨 套 循环 
中 ， 两 个 范围 变量 c1 和 c2 开 不 依赖 地 在 customers 表 的 行 上 变化 ec 而 我 们 呆 以 试 为 上 述 查 询 
的 结果 是 由 图 3-3 的 伪 码 产生 的 。 


FOR cE FROM ROW 1 TO LAST DF customers 
FOR ce FROM ROW 1 TO LAST OF customers 
IF tel,city = cto.cfty and cl cid < ce.cid’ 


THEN PRINT OUT SELECT_LIST YALUES: cl.cid, c2.cid 
[CN FOR ce 
END FOR cl 





图 3-3 例 3.3.6 的 Select 语 可 的 垦 套 循环 访问 计划 护 友 


图 3-3 检 索 到 的 值 与 我 们 期 望 得 到 的 例 3.3.6 Select 语 句 的 值 是 相同 的 。 这 种 效 大 循环 
( nested-loop ) 算法 产生 了 与 我 们 实际 建立 的 笛 卡 儿 积 c1 x c2 相 同 的 行 对 。 实 际 上 ， 这 种 艇 
食 的 循环 是 我 们 能 产生 管 卡 负 积 行 对 的 唯一 途径 。 在 图 3-3 的 算法 中 ， 我 们 没有 将 这 些 行 对 放 
全 个 临时 表 中 ， 而 是 通过 执行 Select 语 句 的 下 一 个 慨 念 性 步 又 并 实施 WHERE 子 句 的 选择 条 
件 来 缩短 处 理 过 程 。 绪 订 ， 骨 套 循环 方 落 在 空间 利用 率 上 比 第 一 步 实 际 建立 稠 卡 儿 积 的 方法 
要 高 得 多 ， 

人 裔 套 循 环 算 法 仅仅 是 涉及 到 笛 卡 几 积 操作 的 Select 滞 句 可 选 做 访问 计划 的 众多 算法 中 的 一 
个 。 还 有 草 的 算法 存在 ， 鲍 如 ， 可 以 利用 能 极 大 地 改进 性 能 的 索引 查找 功能 。 但 不 管 怎么 说 ， 
般 套 循环 算法 代表 了 另 一 种 有 助 于 我 们 理解 Seleet 语 名 的 概念 性 观点 。 我 们 明白 了 为 什么 范围 
变量 旦 诸如 c1 和 c2 之 类 的 变量 的 共同 术语 ， 因 为 它们 在 和 能 套 循 环 中 是 代表 行 位 置 的 循环 变 
其 ; 每 一 个 由 行 位 置 组 成 的 对 对 应 于 管 卡 儿 积 表 中 的 -一 行 。 很 明显 我 们 可 以 将 这 种 方法 推广 
到 在 不 同 的 或 相间 的 表 上 定义 的 任意 数目 的 范围 变量 上 去 。 注 意 ， 如 果 指 定 的 表 没 有 别名 ， 
表 名 本 身 也 可 以 被 认为 是 一 个 载 有 特定 行 值 的 范围 变量 。 让 我 们 重新 思考 例 3.3.4 的 查询 过 程 : 

select distinct customers.cname,. agetrts.aname 


from customers, orders, gents 
where customers. cid = arders,cid ard orders.aid = agents.aid: 
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在 这 里 ， 我 们 以 为 该 Select 诸 名 有 三 个 独立 的 范围 变量 : customers, agents 和 orders。 
由 这 三 个 独立 的 变量 在 一 个 三 重 答 大 循环 中 占据 它们 各 自 表 中 的 行 位 置 而 得 到 的 值 实际 上 就 

会 出 现在 三 个 表 的 关系 代数 笛 卡 儿 积 中 的 和 值 。WHERE 子 名 基本 上 选 出 了 能 由 三 个 表 进 行 连 
接 而 得 到 的 行 ， 只 是 这 里 不 要 求 customers 和 agents 的 city 列 相等 . 


例 3.3.7 找 出 至 少 被 两 个 左 客 订购 的 产品 的 pia 什 。 我 们 可 用 表 别 名 来 解决 这 个 问题 : 


sealect distinct xl1.pid 
from orders xl, Orders Xe2 
where xl.pid 一 x2.pid and xl.cid < x2.cid; 


考虑 此 查询 的 最 佳 方法 是 xz1T 和 x2 各 自在 crders 表 的 行 上 变化 (有 时 候 它 们 代表 条 一 
行 ) 。 条 件 x1.cid < x2.cia 保 证 了 这 两 行 分 别 代 表 由 不 同 的 项 客 订购 的 产品 而 且 同 样 的 
行 对 只 出 现 一 次 ， 而 条 件 x1 ,pid = x2.pid 保 证 了 两 个 顾客 ? 购 的 是 同一 产品 。 我 们 打印 
出 所 有 具有 性 质 一 一 被 两 个 不 同 的 顾客 订购 的 产品 。 四 


上 述 分 析 中 很 重要 的 一 点 是 要 确保 被 位 于 orders 表 的 不 同行 xz，y，z 上 的 三 个 顾客 订购 
了 的 产品 在 结果 中 不 出 现 三 次 : x 和 y 的 组 合 一 次 ，x 和 和 z 的 组 合 一 次 以 太 y 和 z 的 组 合 一 次 。 为 
了 去 除 重复 的 行 我 们 需要 使 用 例 3.3.3 中 介绍 的 保留 字 DISTINCT。 关 键 词 DISTINCT 往 往 会 加 
重 执行 查询 的 过 程 的 工作 芥 。 访 问 计划 通常 此 求 结 果 行 根据 被 检索 到 的 列 值 排 好 序 并 旦 要 测 
试 连续 行 的 相等 性 以 避免 重复 。 如 果 用 户 知 道 没 有 重复 的 可 能 性， 那 就 有 可 能 改进 整个 执行 
过 程 以 避免 这 种 额外 的 工作 。 然 而 ， 知 道 重复 什么 时 候 可 能 出 现在 连接 查询 以 履 其 他 一 些 形 
式 中 并 不 基 一 件 简单 的 事 。 我 们 会 在 本 章 结 尾部 分 的 习题 中 继续 讨论 这 - -问题 。 

例 3.3.8 ”查询 那些 订购 了 某 个 被 代理 商 a06 订 购 过 的 产品 的 顾客 的 cid 值 。 没 计 这 一 查询 
所 需要 的 重要 思想 我 们 以 前 在 关系 代数 中 已 介绍 过 了 【( 见 例 2.9.9 }， 我 们 必须 要 认识 到 此 请 求 
并 不 是 想 要 通过 a06i 货 的 顾客 的 cia 值 ， 而 是 比 那 间接 得 多 。 见 图 3-4， 我 们 希望 检索 的 行 集 
被 包 会 在 最 右 而 的 那个 圈 中 。 


订购 了 其 
中 位 何 产 


名 的 三 客 





图 3-4 例 3.3.8 中 的 对 荣 集 台 以 及 它们 之 癌 的 联系 
首先 ， 考 虑 钾 代 理 商 a06 订 购 的 产品 ， 即 图 3-4 中 中 间 那 个 圈 包 宫 的 行 集 。 


select x-pid from orders x Where X-afd ~ “aa06 ; 


被 该 查询 从 图 2-2 的 corders 表 中 检索 到 的 产品 TD 集合 为 {p03，p01)。 现 在 我 们 想 要 检 
索 订 网 了 其 中 的 至 少 一 -个 产品 的 顾客 。 我 们 需要 考虑 orders 表 中 所 有 不 同 的 行 以 列 出 这 样 的 
顾客 。 葬 如 ， 订 单 号 1017 所 在 的 行 表明 p03 是 通过 代理 商 a06 订 购 的 ， 问 时 该 行 还 显示 顾客 
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c001 订 购 了 零件 p03。 然 而 ， 订 单 号 为 1013 的 行 显示 c002 也 订购 了 p03， 尽 管 他 不 是 通过 代理 
商 a06 订 购 的 。 这 两 行 我 们 都 需要 考虑 以 显示 ec002 也 在 上 述 请 求 的 选择 序列 中 。 我 们 将 上 述 思 
想 都 集中 到 上 面 的 查询 中 : 
select distinct y.cid 
from orders XX, orders y 
where y.pid 一 其 .pid and x.aild = “abi"; 
在 这 里 我 们 看 到 ， 当 范围 变量 x 对 应 orders 表 中 ordno-=1017 的 行 (由 十 x.aid=a06 
日 x .pia-p03 ) 而 范围 变量 y 对 应 or aers 表 中 ordano=1013 的 行 (由 于 y .pid=x.,pi 旨 
y.cigd=c002) 时 ， 检 索 到 的 是 ci9 为 c002。 此 查询 返回 的 是 下 面 的 表 : 





回顾 上 述 过 程 ， 该 查询 形式 体现 了 一 种 极其 重要 的 思想 ， 即 同时 需要 oraers 丰 上 两 个 不 同 的 
范围 变量 以 便 将 检索 到 的 cia 值 与 aid 值 为 a06 的 代理 商 联系 起 来 。 加 

在 这 一 节 里 ， 我们 介绍 了 图 3-5 列 出 的 Select 语 句 的 有 限 形式 。 形 式 [ALL | DISTINCT] 中 
的 竖 杠 意味 着 用 户 能 在 ALL 和 DISTINCT 这 两 项 中 选 一 个 ; 该 选择 被 包含 在 方 括号 ([ 里 说 明 
整个 短语 是 可 选 的 ， 而 ALL 被 加 了 下 划 线 则 意味 着 如 果 该 短语 被 忽略 那 它 就 是 缺 省 的 有 效 选 
项 。WHERE 子 句 中 的 搜索 条 件 对 象 fsearch-conaicion) 本 身 就 显得 相当 复杂 ， 它 是 本 章 
许多 入 的 讨论 主题 。 


SELECT [ALL | DISTINCT] { * | expr ELAS] c_alias] ll, expr [[AS] c alias]...}} 


FROM tablename [LAS] corr_nama] {, tablename [EAS] corr name]...1 
CHHERE search condit1on}: 





图 3-5 3.3 节 所 介绍 的 Select 语 句 语 法 


3.4 子 查询 


每 个 Select 查 谢 都 会 生成 一 张 表 ， 但 是 我 们 不 能 像 在 第 2 章 里 艇 人 关系 代数 表达 式 那 样 任 
意 地 将 一 个 Select 语 名 赃 人 另 一 个 Select 语 句 。 最 明显 的 一 个 限制 是 在 Select 语 各 的 FROM 了 名 
中 出 现 的 表 本 身 不 能 是 任意 Select 语 句 的 结果 (Full SQL-92 和 SQL-99 标 准 已 去 掉 了 这 项 限制 ， 
但 这 项 特性 在 现 有 的 数据 库 产品 中 并 未 得 到 完全 实现 )。 这 是 SQL 与 关系 代数 的 一 个 很 重要 的 
不 同 点 ， 因 为 这 意味 着 失去 了 关系 代数 所 具备 的 菜 些 姐 套 功能 的 Select 语 句 必须 通过 增加 别 的 
功能 来 作为 补 伴 。 我 们 在 WHERE 子 句 的 搜索 条 件 中 能 发 现 这 些 新 增加 的 功能 。 我 们 将 会 看 到 ， 
在 搜索 条 件 中 其 入 某 些 形式 的 Select 语 名 是 完全 可 能 的 。 

出 现在 另 一 个 Select 语 名 之 内 的 Select 语 名 形式 被 称 为 子 查询 ( subquery )。 子 查询 的 通用 
形式 缺乏 完全 Select 语 句 所 具备 的 某 些 语法 元 素 ， 但 我 们 还 要 过 一 段 时 间 才 会 接触 到 这 些 语 法 
元 素 ， 而 图 3-$ 中 的 形式 就 可 以 被 当 作 是 子 查询 。 昌 前 我 们 可 以 认为 Select 理 柯 和 子 查 疯 这 两 
种 形式 是 等 同 的 。 一 个 子 查询 能 以 众多 方式 出 现在 另 一 个 Select 语 名 的 WHERE 子 句 搜索 条 件 
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中 。 在 这 一 节 里 ， 我 们 要 学 习 许 多 谓词 (predicate ) 和 具有 TRUE-FALSE 人 慎 的 逻辑 条 件 ， 泥 
们 允许 我 们 对 子 查询 进行 有 意义 的 调试 。 我 们 首先 考虑 IN 请 词 ， 它 测试 一 个 集合 的 成 员 资 格 。 

1. IN 谓词 

恨 定 我 但 希 望 求 出 通过 和 住 在 Duluth 或 Dallas 的 代理 商 订 丁 货 的 顾客 的 cid 值 ， 一 种 可 能 的 
解法 是 在 SQL 中 对 几 个 表 做 笛 卡 玫 积 ,但 这 里 关心 的 是 如 和 何 举例 说 明 IN 谓 词 的 用 法 以 及 新 的 
子 查询 请 法 。 

例 3.4.1 求 出 通过 住 在 Duluth 或 Dallas 的 代理 商 订 了 货 的 顾客 的 cia 值 。 我 们 从 找 出 所 有 
住 在 Duluth 或 Dallas 的 代理 商 开 始 。 此 问题 可 用 下 面 的 查询 来 解决 : 


select aid from eyents 
where city = "Duluth’ or city = ‘Dallas',; 


该 Select 语 名 可 被 当 作 是 一 个 值 集 ( 子 查询 ) 而 放 入 一 个 砚 大 的 解决 原 问题 的 Sejiect 请 句 : 


select distinct cid from orders 
where atd nm {select aid from agents 
where city = Duluth’ or city = "Dallas').: 


从 概念 上 来 讲 ， 我 们 把 子 查 询 (由 插 号 包围 的 内 层 Select 诸 句 ) 视 为 向 外 层 Select 语 句 的 
WHERE 子 句 返回 的 一 个 值 集 : "...where aiad in (seDy"。 如 果 外 层 Select 语 句 中 的 orders 表 当 
前 行 的 aia 值 是 内 层 Select 语 名 返回 的 集合 的 一 个 匹 素 {aia 值 在 集 人 台中 )， 外 层 Select 语 句 的 
WHERE 子 句 就 被 认为 是 真 (true)。 特 别 地 ， 对 于 图 2-2 的 数据 库 内 容 ， 出 子 查询 返回 的 aid 侦 
集合 为 a05 和 a06。 接 着 ， 在 外 层 的 Select 语 句 中 ， 要 选择 的 行 被 限定 为 orders 表 中 那些 aiqd 
秆 是 该 集合 的 成 员 的 行 。 最 后 ， 结 果 行 的 cid 值 被 打印 出 来 。 此 查询 的 答案 为 





成 员 资 格 的 测试 不 仅 能 在 由 子 查询 提供 的 集合 上 进行 ， 还 能 在 显 式 定 义 的 集合 上 进行 ， 
我 们 将 在 下 面 的 例子 中 看 到 这 一 点 。 
例 3.4.2 ”检索 有 关 住 在 Duluth 或 Dallas 的 代理 商 的 所 有 傍 息 (与 前 一 例子 中 的 子 查询 非常 
相似 ), :这 可 以 通过 下 面 的 查询 来 实现 : 
select * from agents 
where city in CDuluth:, "Dallas'}; 


我 们 看 到 ， 一 个 集合 可 以 由 置 于 括号 中 的 被 去 号 分 隔 的 常数 序列 构造 而 得 。 此 查询 返回 
如 下 的 表 ， 


oa | 









ee 
Fz 





El 
Ea 
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上 上述 查 询 与 使 用 适 辑 或 (DR) 的 查询 有 异曲同工 之 妙 : 


select * from agents 
where tity = "Duluth sr city = ‘Dallas': 


我 们 会 发 现 ， 在 下 面 的 例子 里 出 现 了 于 查询 的 多 层 艇 套 。 

例 3.4.3 求 出 通过 住 在 Duluth 或 Dallas 的 代理 商 订货 的 所 有 顾客 的 姓名 和 折扣 。 我 们 使 出 
下 面 的 语句 形式 : 

Select cname, discnt from customers 


where cid in tselect cid from orders where aid in 
{select aid from agerts where city in f'Guluth', Dallas')}}: 


注 臣 ， 最 内 屋子 查询 中 的 city 列 显然 与 agents 表 相关 ， 而 不 是 与 最 外 层 Select 语 名 中 的 
customers 肯 相关 ,，agents 表 是 city 这 个 列 名 最 为 局 部 的 “作用 域 "。 此 查询 返回 下 肯 : 


10.000 


| 


到 目前 为 止 的 例子 所 涉及 的 于 查询 都 是 在 没有 接受 任何 输入 数据 的 情况 下 向 外 层 的 Select 
语句 传递 一 个 行 集 。 这 些 子 查询 被 认为 是 非 相 关子 查询 ， 国 为 内 层 的 子 查 测 完全 独立 于 外 层 
的 Select 酝 人 柯 。 更 一 般 的 情况 是 ， 我 们 能 回 内 层 子 查询 提供 及 和 月 外 层 Select 埋 何 的 数据 . 

例 3.4.4 ” 找 册 霜 购 了 产品 BO05 的 顾客 的 名 字 。 当 然 ， 我 们 可 用 最 直接 的 Select 语 句 当 解 决 
这 个 查询 问题 : 


select distinct cname from customers, orders 
where customers, cid = orders,.cid and orders,pid = ‘pOS':; 


但 是 ， 这 里 感 兴趣 的 是 子 查询 从 外 层 Select 语 句 中 接收 数据 的 解法 : 


selpct distinct cname from customers where ‘pO5' in 



















tselect pid from orders where cid = customers.cid);: 
该 查询 返回 下 表 : 





如 果 这 些 Select 语 句 没 有 包含 关键 词 DISTINCT， 那 它们 将 在 两 个 不 同 的 行 上 检索 到 
cname 值 Allied。 在 这 章 结尾 的 习题 中 ， 你 需要 验证 许多 有 助 于 预测 不 带 关 键 词 DISTINCT 的 
Select 语 名 什么 时 候 会 产生 重复 行 的 规则 。 要 特别 注意 的 是 ， 与 上 面 第 二 个 Select 语 名 的 子 查 
痢 所 引用 的 未 限定 的 cia 相 关 的 应 是 corders 表 。 当 一 个 子 查询 包含 单独 一 个 表 时 ， 它 就 不 而 
要 以 限定 形式 来 访问 局 部 而 名 。 但 在 上 例 中 ,涉及 customers ,cid 的 子 查 询 要 访问 外 层 
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Select 砷 句 中 的 表 ， 所 以 在 那 种 情况 下 限定 符 是 必需 的 。 

一 个 友 使 用 外 层 Select 语 名 所 提供 的 数据 的 子 查询 被 认为 是 相关 于 查询。 此 类 于 查询 通常 
其 有 这 样 的 性 质 ， 即 在 外 层 Seleet 语 名 开 始 执行 以 前 它 不 能 被 一 次 性 地 彻底 解 出 ， 而 这 意味 着 
对 执行 过 程 风 优化 将 很 难 进行 。 倒 如 ， 在 例 3.4.4 的 子 坦 询 形式 中 ， 我 们 在 确定 
cugstomers.ciad 的 值 之 前 就 求 不 出 被 内 层 子 查 诲 检索 到 的 pia 和 值 集 合 ， 而 
customezrs .ecid 的 值 对 于 外 层 Select 的 每 一 行 来 说 都 是 不 同 的 ， 

尽管 内 屋子 查询 能 使 用 来 自 外 层 Select 语 句 的 变量 ， 但 反之 则 不 然 。 我 们 可 以 将 这 视 为 一 
种 作用 域 规则 ， 这 相当 于 我 们 在 诸如 C 之 类 的 众多 编程 语言 中 轴 到 的 作用 域 局 部 性 规则 。 在 
SQL 下， 一 个子 查 淹 的 局 部 变 凋 在 进入 该 子 查询 以 前 是 不 被 定义 的 。 

例 3.4.5 如果 我 们 想得到 从 代理 南 a03 处 订购 了 了 产品 p07 的 顾 穷 的 名 闻 ， 下 面 的 查询 形式 
是 不 合法 的 : 

salect cname from tustomers 


where orders,aid = “ad and ‘pO7F” in -- ** TLLEGAL SAL SYNTAX 
(select pid from orders where cid = customers.cid), 


上 面 的 诺 避 之 所 以 不 合法 是 因为 对 orders -aia 的 引用 发 千 在 它 的 正确 作用 域 之 外 。 | | 

IN 谓 词 表 达 式 的 道 用 形式 到 目前 为 下 已 有 两 种 不 同 的 形式 : 

expr in CSubquery) | expr in Cyal 二 val...}) 
expr 记 号 代表 我 们 在 例 3.3.5 的 选择 列表 中 见 到 的 那 种 字符 毕 表 达 式 或 数值 表达 式 ， 最 常见 的 
情况 是 一 个 简单 的 烈 名 或 常数 ; 当然 ，expr 也 可 能 是 如 我 们 在 下 面 例 3.4.6 中 所 见 的 一 个 “小 
达 葡 序列 ”， 即 一 个 由 有 束 号 分 隔 的 表达 式 序 列 。val 记 号 代表 一 个 常数 ， 比 如 17 或 Duluth' 或 者 
也 可 能 是 由 如 号 分 隔 的 常数 序列 。 

例 3.4.6 检索 由 住 在 Duluth 的 顾客 和 住 在 New York 的 代理 南 组 成 的 所 有 订货 记录 的 
ordno 值 。 下 面 这 种 测试 一 对 值 是 否 包 含 于 子 查 询 的 形式 是 基本 SQL 所 支持 的 。 

select brdno from grders 

whare (cid, aidy in 


{select cid, aid frow customers &, gents a 
where ccity = Duluth nd a.city = New York"'}; 


Fu SQL-92 和 SQL-99 人 允许 对 由 这 号 分 隔 的 表达 式 序 列 、 变 量 对 或 更 长 的 元 组 进行 针对 子 
查 诲 的 成 员 资 格 测试 ， 只 要 它们 能 如 上 所 示 被 放置 在 插 导 中 。 也 许 你 下 在 使 用 的 产品 还 不 县 
簿 这 项 扩展 特性 。( 在 写 这 侣 话 的 时 懂 ， 访 特性 已 在 ORACLE 利 DB2 中 出 现 ， 但 还 未 在 
INFORMIX 中 出 现 ,。) 适用 于 这 些 产品 的 另 一 种 标准 SQL 形式 是 这 样 的 : 


select ordno from orders x where exists 
{select cid, aid from customers cc. agents a 
where c.cid = x,.cid and a.aid = Xaid and ecity = “Duluth' and a.city 一 “NEW York"y: | | 


隐藏 在 expr IN (Supquery ) 格式 后 面 的 思想 一 一 通过 求解 子 查 询 返 回 一 个 值 集 然后 
由 外 妓 Select 语 名 来 进行 成 员 资 格 测试 一 一 是 相当 吸引 人 人 的。 但 这 里 很 重要 的 一 点 是 要 能 再 次 
认识 到 这 仅仅 是 一 个 概念 性 的 过 程 ; 在 很 多 情 视 下 这 并 不 是 系统 在 建立 访问 计划 时 所 采用 的 
方法 。 我 们 在 这 一 竟 的 后 面 会 看 到 ，SQL Select 语 句 是非 和 过程 性 的 ， 这 意味 着 发 出 查询 的 用 户 
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并 不 指定 系统 在 回答 这 个 查询 时 应 使 用 的 算法 。 我 们 已 上 暗示 过 ， 系 统 中 被 称 为 查询 优化 器 
(query optimizer) 的 那个 功能 模块 会 将 查 淘 转化 成 众多 不 同 的 形式 ， 然 后 从 中 选 出 能 最 高 效 地 
产生 结果 的 那 种 形式 。 本 章 结尾 部 分 的 一 道 习题 表明 : 到 日 前 为 止 书 介 绍 的 所 有 涉及 在 子 查 
询 上 使 用 IN 谓词 的 查询 都 能 被 转化 成 不 用 子 查询 而 对 FROM 子 杀 中 的 表 做 笛 卡 几 积 的 另 一 种 
形式 。 这 是 实际 执行 查询 时 系统 可 能 会 采用 的 一 种 的 转化 方式 。 

除了 IN 谓词 以 外 ,还 有 NOT IN 谓词 。 例 如 ，、 子 句 

expr NOT IN Subqguery) 
为 真 当 日 仅 当 求解 出 的 expr 值 不 在 由 子 查询 返回 的 集合 中 。MNOT IN 谓 词 也 适用 子 在 常数 集 
上 进行 成 员 资 格 测试 的 形式 。 图 3-6 显 示 的 是 IN 谓词 的 通用 形式 ， 可 选 的 NOT 被 放置 在 关键 词 
IN 的 前 面 . 


expr [NOT] IN (Subquery) | expr [NOT] IN (val {, val...}) 
图 3-6 IN 谓词 表达 式 的 通用 形式 


2. 量 屁 比较 请 词 
量化 谓词 将 一 个 简单 的 表达 式 值 和 子 查 询 的 结果 进行 比较 。 它 的 通用 形式 显示 于 图 3-7。 


expr OSOME|ANYIALLT 《SUbQUerY) 


where 自 is some operator in the set {<, Ce, 2“, 3. PD, >™) 





图 3-7 量化 谓词 的 通用 形式 


有 天 八 种 谓词 满足 这 种 通用 形式 。 该 形式 中 的 SOME 和 ANY 含 义 相 则 ， 击 SOME 则 是 绝 大 
多 数 数 据 库 产品 的 最 新 版 本 所 推 梁 的 形式 。 

现 给 出 量化 谓词 的 定义 : 对 于 某 个 属于 集合 {<, <=, =, <>, >, >=} 的 比较 运算 符 8， 两 个 等 
价 的 谓词 expresome (subheuervy) 和 expreany(Subquery) 为 真 ， 当 及 仅 当 至 少 存在 一 个 由 
子 查询 返回 的 元 素 s ，expr9s 为 真 ， 谓词 expr9all (Subquery) 为 真 当 且 仅 当 对 每 一 个 由 
子 查询 返回 的 元 素 s，expres 为 其 。 下 面 我 们 给 出 说 明 这 些 谓词 用 法 的 例子 。 

例 3.4.7 找 出 佣金 百分率 最 小 的 代理 商 的 aid 值 。 这 可 以 通过 下 面 的 查询 来 实现 : 

select atd from agents where percent <eall (Select percent from agents}, 

子 查询 返回 agents 表 中 的 所 有 Percent 值 ， 然 后 量化 比较 请 词 <=ALL 要 求 被 选择 行 的 
percent 值 小 于 或 等 于 由 于 查询 返回 的 所 有 值 ， 因 此 ， 被 选中 的 行 的 percent 值 将 是 同类 中 
的 最 小 值 。 辐 

例 3.4.8 ” 找 出 与 住 在 Dallas 或 Boston 的 顾客 拥有 相同 折扣 的 所 有 顾 容 。t 注意 ， 在 图 2-2 
的 例子 中 没有 闫 客 住 在 Boston ， 但 满足 用 户 请 求 的 正确 查询 形式 应 该 不 依赖 于 属于 某 个 特定 
时 刻 的 “偶然 的 ” 表 内 容 。) 我 们 使 用 查询 : 


salect cid, cname from Customers 
where discnt msome {select discnt from customers 
Where city = "Dallas’ or city = 'Boston’}, 


被 选择 行 的 ai scnrnt 值 必须 与 被 子 查询 检索 到 的 至 少 一 个 ai scnt 值 相等 ， 也 束 是 说 被 选择 的 
行 拥 有 与 某 个 住 在 Dallas 或 Boston 的 顾客 相同 的 4aiscnt 值 ,注意 谓 训 =SOME ... 与 谓词 IN .… 
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具有 完全 相同 的 效果 。 这 是 一 个 相对 令 人 吃惊 的 事实 ， 我 们 会 在 本 节 的 后 面部 分 讨论 这 -- 问 
题 。 国 

注意 ， 虽 然 谓 词 expr=SOME {Subquery) 与 expr IN(Subquery}) 傅 义 相 同 ，expr 
NOT IN {Subquery}) 却 不 等 价 于 expr <>SOME {Subquery})。 事 实 上 , 与 expr NOT 
IN (Subquery) 等 价 的 是 expr <>ALL {Subquery) ， 这 也 是 你 应 验证 的 。 

ANSI SQL 标 准 对 ANY 和 SOME 的 定义 是 相同 的 ， 并 且 支 持 将 谓词 9 ANY 替 换 成 6 SOME 
的 用 法 。 这 种 苦 换 之 所 以 能 成 功 是 因为 “any” 在 英语 中 的 用 法 本 身 就 非常 容易 引起 歧义 。 

例 3.4.9 求 出 所 有 满足 以 下 条 件 的 顾客 的 cid 值 ， 该 顾客 的 dis cnt 值 小 于 任 一 (any) 住 在 
Duluth 的 顾客 的 aiscnt 值 。 如 果 在 用 户 提 出 这 一 请 求 的 时 候 我 们 正好 感到 有 些 困倦 ， 那 很 可 
能 会 有 下 面 的 Select 语 句 ， 而 它 并 没有 实现 我 们 所 期 望 的 结 采 : 

select cid from customers 

where disent <any -~- *# WRONG EFFECT 
{select discnt from customers where city = “Duluth'}: 
将 该 Select 语 名 应 用 于 图 2-2 的 customers 表 ， 上 述 子 查 询 返 回 discnt 值 集合 {10.00, 8.00}， 
其 中 的 两 个 元 素 分 别 对 应 十 cid 值 为 c001 和 c004 的 顾客 。 根 据 定义 ，discnt 值 8.00 会 导致 稍 
词 qiscnt<any{10.00,8.00} 为 真 。 这 是 因为 8.00<10.00( 也 就 是 说 ， 子 查询 中 至 少 一 个 大 
素 s 使 得 expr<s 为 真 )。 因 此 ， 整 个 Select 语 名 将 返回 cia 值 集合 {fc003, c004, c006}， 但 这 并 不 
是 我 们 实际 想 要 的 结果 。 原 题 中 的 请 求 可 以 改写 为 求 出 所 有 满足 以 下 条 件 的 顾客 的 cid 值 : 
该 顾客 的 ai scnt 值 小 于 所 有 (al) 住 在 Duluth 的 顾客 的 aiscnt 值 。 在 原来 的 表述 中 ， 词 语 any 
的 英文 含 闵 起 了 误导 必用。 实现 目标 的 正确 Select 语 句 为 : 
select cid from customers 


where discht <all fselerct discnt from Customers 


where city = Duluth}: 
| 


如 果 我 们 所 用 的 谓词 没有 包含 任 一 (any}， 而 仅 涉及 到 某 些 (some)， 那 我 们 掉 人 这 类 陷阱 
的 可 能 性 就 会 小 得 多 。 

除了 某 些 产品 可 能 还 不 认同 这 种 使 用 SOME 的 新 形式 以 外 ， 所 有 的 商用 数据 库 产 品 都 支持 
上 面 提 到 的 量化 谓词 集合 。 我 们 采用 米 自 SQL-92 和 SQL-99 标 准 的 命名 协议 ; 参见 本 章 结尾 部 
分 的 推荐 读物 中 由 Jim Melton 和 Alan R，' Simon 编 写 的 《Understanding the New SQL2》( 《理解 
新 的 SQL》)， 有 关 这 个 主题 的 内 容 被 编 在 该 书 的 索引 条 目 “ 量 化 比较 谓词 ”下 。《 ORACLE 
Sever SQL Languase Reference Maraely》(《 ORACLE 服务 器 SQL 语言 参考 手册 ) 将 该 主题 分 
作 三 个 独立 的 部 分 来 讨论 :“ALL 比 较 运算 符 ”",“ANY 比较 运算 符 ” 以 及 “SOME 比 较 运算 符 ”。 
《 ORACLE SOL Manual} (《 ORACLE SQL 手 册 》) 没 有 包含 “量化 谓词 ”甚至 是 “ 确 间 ”的 
索引 条 上 日， 取而代之 的 是 “条 件 ”。《 INFORMIX Dynamics Server Guide To SQL Syntax» 
(《INEFORMIX 动 态 服 务 器 SQL 语法 指南 》) 也 把 “谓词 ” 称 做 “条 件 ”。 包 插 《DB82 Universal 
Database SOL Reference )( 《DB2 Universal Database SQL 参考 ) 在 内 的 大 多 数 其 他 参考 文献 
则 把 该 主题 编 在 索引 条 目 “量化 比较 请 词 ” 下 。 

3, BXISTS 请 词 

EXISTS 谓 词 测试 被 子 查询 检索 到 的 行 集 是 否 为 非 空 。 图 3-8 显 示 了 该 谓词 的 通用 形式 。 
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ENOT] EX1STS 《Subquery ) 


图 3-8 Exists 谓 启 的 通用 形式 


谓词 EXISTS ( Subguery ) 为 真 当 用 仅 当 子 查询 返回 一 个 非 空 的 集 含 《如 果 集 合 中 存在 元 
素 ) 谓语 NOT EXISTS ( Subquery }? 为 真 当 旧 仅 当 返 回 的 集合 为 空 。 


例 3.4,10 ”检索 通过 代理 商 a05 订 货 的 所 有 顾客 的 名 字 。 此 查 调 的 基本 思想 是 看 ordqers 
表 中 是 否 存 在 一 个 连接 cname 和 代理 简 a05 的 行 。 


select distiret ee,cname from customers cc 
where exists {select * from orders % 
where ccid = x.cid and x,aid = a05"): 


注意 子 查询 的 选择 序列 为 *， 而 不 是 某 个 单独 的 属性 ; 这 是 测试 于 查询 的 结案 是 省 为 空 的 
最 简 方 法 。 从 图 2-2 的 表 中 检索 到 的 是 分 别 对 应 于 cia 值 c091 和 c002 的 顾客 名 学 : TipTop 利 
Basics。 注 意 上 而 查询 中 的 相关 变量 x 不 是 必需 的 ， 这 里 包含 它 仪 仅 是 为 了 便于 和 下 而 的 男 
一 种 解 落 伏 比较 ; 


splect distinct c.cname from customers c¢, orders x 


Where ecid = icid and x.aid = “a0h'; 


此 查询 也 解决 了 提出 的 问题 。 注 意 ， 如 果 上 面 的 两 个 查询 都 没有 包含 关键 词 DISTINCT， 
那么 customers 表 中 拥有 相同 顾客 名 字 的 不 同行 各 自 对 cidq 列 进行 限定 会 导致 名 字 的 重复 
显 小 。 国 

我 们 看 到 ， 第 二 种 查询 形式 与 使 用 了 EX1STS 谓 词 的 第 一 种 查询 形式 非常 相似 。 为 了 对 两 
者 加 以 比较 ， 需 要 考虑 以 下 几 点 。 上 例 中 的 第 一 个 查询 明确 要求 orders 表 中 存在 这 样 的 4x， 
它 把 customers 表 中 的 行 c< 和 代理 商 a05 联 系 到 一 起 ， 而 第 二 个 查询 则 利用 了 这 样 的 行 *， 但 
没有 对 它 进行 任何 约束 : x 仅 出 现在 WHERE 子 句 的 搜索 条 件 中 。 这 种 出 现在 WHERE 子 人 句 中 但 
未 被 选择 列表 使 用 的 范围 变量 类 似 于 数理 逻辑 中 的 自由 变量 (unbound variable)。 我 们 有 理由 
问 :， 在 这 种 情况 下 ， 必 须 产 生 什么 样 的 事件 才能 使 WHERE 子 名 为 真 ?” 从 直观 上 理解 ， 我 们 一 
直 认 为 答案 是 : 如 果 存 在 使 得 WHERE 子 句 为 真 的 自由 变量 值 ( 行 )， 那 WHERE 子 名 就 为 真 ， 
也 就 是 说 ， 在 上 例 中 必须 存在 满足 c ,ciq = x.cid 目 x.aid = 'a05' 的 行 Xx。 这 样 ， 日 由 
变量 x 就 好 像 也 受到 了 谓词 existsilselect * from orders Xx ... ) 的 约束 。 

上 上 述 全 部 讨论 表明 ，EXISTS 谓 词 的 正 向 形式 ( 即 不 加 NOT 的 形式 ) 不 是 构造 查询 所 必需 
的 ;使 用 -个 崩 由 变量 也 能 完成 查询 任务 。 在 求解 习题 的 时 候 要 尽 可 能 地 避免 使 用 Selectt 上 名 
的 复杂 形式 ; 特别 是 ， 林 到 万 不 得 已 的 时 候 不 要 使 用 EXISTS。 

例 3.4.11 ”回顾 鲍 2.9.8 中 需要 进行 关系 代数 交 运 算 的 请 求 : 求 出 既 订 购 了 产品 p01 艾 订购 
了 产品 p07 的 顾客 的 cia 值 。 当 时 使 用 的 查询 语句 是 : 

{0 whare pid = "pol77[cid] MAD where pid 一 “pPO7 YLceid} 


在 SQL 中 ， 我 们 很 自然 地 会 使 用 EXISTS 谓 词 的 正 向 形式 来 实现 此 查 河 ; 


select distinct cid from orders x 
where pid = 'pOl” dnd exists ($elect * from orders 


Where fid = x.cid and pid = "p07'}); 
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然而 ， 我 们 也 可 以 使 用 不 带子 查询 的 查询 形式 来 实现 此 查询 : 


Select distinct x,ctd from orders x, orders y 
where x.pid = ‘pOl' and x.cid = ycid and y.pid = pOA' 


男 一 方面 ,NOT EXISTS 谓 词 也 确实 为 我 们 带 来 了 一 些 新 的 功能 。 


例 3.4.12 ”检索 设 有 通过 代理 商 a05 订 货 的 所 有 顾客 的 名 字 。 此 查询 正好 检索 那些 没有 被 
例 3.4.10 的 查询 检索 到 的 顾客 名 字 。 注 意 ， 将 例 3.4.10 的 第 二 个 Select 语 句 的 搜索 条 件 简 单 地 取 


反 会 产生 错误 的 结果 。 
seETEct tC.cname from customers te, orders x 
where not (tc.cid = x.cid and x.aid = ‘a0s'): -- * HRONG EFFECT 


在 customergs 表 中 ， 什 么 样 的 行 c 能 使 条 件 nettc.cia =x.cid and x,aid='a05' ) 为 真 
呢 ? 考虑 满足 c.cid ='co01 的 顾客 c 以 及 oraers 表 的 第 一 行 ( 它 满足 xcjid = 'c001' 且 x.aid 
=1a01 )。， 对 于 这 些 c 和 和 x，x,aiq = a05 :为 假 ， 因 此 条 件 not (tc.ciqd = x.ciqd and x.aid 
= 'a05') 为 真 。 即 使 TipTop 确 实 通 过 代理 商 a05 订 了 货 ， 将 这 一 行 的 cname 值 TipTop 当 作 结 果 
来 返 问 也 是 不 杆 确 的 。 上 面 作用 在 揣 由 变量 x 上 的 隐 舍 EXISTS 位 于 以 not 打 头 的 子 名 之 外 ， 其 效 
果 相 当 于 当 存 在 满足 not tc .ciqd = x.cid and x.aid = 'a05') 的 行 x 时 该 条 件 为 真 ; 也 
就 是 说 要 存在 满足 c .ciqd <> x.cid 或 x.aiqd <> 'a05' 的 xz。 这 上 是 个 条 件 都 很 容易 实现 我 
们 刚才 找到 的 zx 满足 c.cia = x.cid 但 x.aid <> 'a05') 但 我 们 实际 想 要 做 的 却 是 当 
orders 表 中 不 存在 满足 条 件 {c.cid = x.cid angd x.aiqd = 'a05') 的 行 x 时 返回 cname 
值 。 因此 ， 我 们 必须 显 式 地 写 出 EXISTS 谓 词 : 
select distinct ec.cname from customers c 


where not extsts feelect * From orders X 
where Cetd = Kx.cid and x.aid = "a05): 


此 查询 正确 地 解决 了 原 问题 。 国 


例 3.4.12 所 使 用 的 NOT EXISTS 谓 词 似 乎 提供 了 一 种 表达 查 和 南 的 新 能 力 。 但 事实 证 明 ， 使 
用 NOT IN 谓词 和 等 价 的 <>ALL 谓 词 ， 我 们 对 许多 查询 已 经 具备 了 这 种 能 力 。 

例 3.4.13 我 们 重新 考虑 例 3.4.12 的 查询 :检索 所 有 没有 通过 代理 商 a05 订 货 的 顾客 的 和 名字。 
这 里 要 用 两 个 等 价 的 谓词 一 -NOT IN 和 <>ALL 来 代替 NOT EXISTS。 两 种 查询 形式 如 下 : 


:2 
where ccid noet in tselect cid from rders where 8td = ‘a0s'): 


以 及 


se]ett ,nae From customers c 
where ccid <yall (seleaect cid from rders where aild = "a0n"'}. 


这 里 很 自然 地 产生 了 一 个 问题 ， 即 NOT EXISTS 谓 词 是 否 具 有 NOT IN 和 <>ALL 人 诊 词 所 不 
具备 的 能 力 。 我 们 将 在 本 章 结 尾部 分 的 习题 中 探讨 这 一 问题 。 国 


NOT EXISTS 育 词 能 拼 用 来 实现 关系 代数 的 MDNUS 运 算 。 
例 3.4.14 ”在 例 2.9.2 中 ， 我 们 为 找 出 没有 通过 代理 商 a03 订 货 的 顾客 的 ciG 值 这 一 请 求 设 
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计 了 一 个 关系 代数 表达 式 。 当 时 有 两 种 可 能 的 解法 。 第 一 种 解法 仅 检 索 到 已 订 过 货 的 顾客 : 


DRDERSECid) 一 【DRDERS where aid = ‘a03"})[ceid) 


对 应 该 表达 式 ， 我 们 有 下 面 的 SQL 语句 : 


select distinct cid from orders Xx 
where not exists (select * from orders 
where cid = Xe 人 and aid = "a03°}: 


此 查询 的 结果 表 如 下 : 


1 村 


例 2.9.2 中 用 一 种 包含 了 没有 订货 的 顾客 的 解法 是 : 


CUSTOMERSTCidj] 一 【DRDERS where aid = "303'}{c1d] 


我 们 将 它 转 化 成 等 价 的 SQL: 


select cid from customers et 
where not exists {select * from orders 
where cid 一 CCid and aid = "a03"): 


在 检索 图 2-2 的 数据 库 内 容 时 这 两 种 解法 是 没有 区 别 的 ， 因 为 那里 不 存在 没有 订货 的 顾客 。 国 

注意 ， 在 高 级 SQL 中 有 - -个 新 的 运算 符 ( 将 在 3.6 节 中 讲述 )， 这 个 被 称 做 EXCEPT 的 运算 
符 直接 复 制 MINUS 运 算 符 的 结果 。 然 而 ， 我 们 正在 学 习 的 许多 产品 偿 不 具备 该 运算 符 。 我 们 
将 在 本 章 的 3.6 节 介绍 新 的 SQL 运算 符 。 

一 般 说 来 ， 如 宁 R 和 S 是 两 个 兼容 的 表 ( 即 Head(R) = Head(S) = Al .An )， 差 R-S 就 可 以 
通过 下 面 的 SQL 语句 来 计算 : 

Select A] - :An from R 


where not exists (select * from Ss 
where S.hy = RA and . . . and S.An 一 R.An}: 


4. SQL 的 缺点 : 过 多 的 等 价 形 式 

正面， 我 们 来 探讨 SQL 语言 有 争议 的 诛 因 之 一 :对 于 同一 查询 ， 经 常会 存在 众多 不 同 的 
构造 方法 。 

例 3.4.15 考虑 检索 订购 了 产品 p01 的 顾客 所 在 的 city 种 这 一 请 求 。 有 四 种 主要 的 Select 
语句 表达 方式 : 


select distinct city from customers where cid Tn 
{select cid from orders where pid = ‘pOl"}: 


select distinct city from Customers where cid =Aany 
rsplect cid from orders Where pid ~ p01l°): 


select distinet city from customers © where exists 
tselect * from orders where cid = ccid and pild = “pl 


select distinet city from customers Cc, orders A 
where x.cid = c.cid and x.pid = "pOl': 
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此 外 ， 还 有 许多 不 那么 显眼 的 方法 ， 比 如 : 


select distinet city from customers © Where “Po ”in 
{select pid from orders where cid = ¢.cid} 加 


由 于 谓词 IN 等 同 于 =ANY， 我 们 似乎 有 理由 对 两 者 的 同时 存在 提出 质疑 。 比 如 ， 去 掉 户 
词 IN 可 能 就 是 个 好 主意 ， 因 为 许多 人 发 现 它 有 有 大量 令 人 疑 感 的 蔡 换 形式 。 事 实 鞋 ， 只 要 能 名 
留 渭 词 [NOT] EXISTS ， 避 右 IN 请 词 和 所 有 的 量化 谓词 (any 或 all ) 也 是 宛 全 可 行 的 。 在 20 直 
纪 70 年 代 早 期 ，IBM 的 一 个 小 组 竭力 提倡 谓词 的 多 样 性 ， 也 就 是 要 对 用 户 更 加 友好 而 不 内存 
在 EXISTS 谓 词 。 这 当然 是 有 争 世 的 。 存 在 这 些 不 同形 式 的 一 个 重要 缺点 是 : 在 开始 构造 查询 
的 时 候 ， 我 们 很 难 单 攒 想象 来 对 所 有 可 能 的 方法 进行 彻底 的 搜索 。 在 关系 代数 中 ， 寻 投 一 种 
构造 一 个 新 查 调 的 方法 所 需 的 一 般 思 维 技巧 是 说 一 些 诸如 “ 喷 ， 我 知道 要 得 到 答案 就 必须 对 
这 二 张 表 进行 连接 ”之 类 的 话 。 但 既然 有 了 子 查 询 ， 我 们 航 不 得 不 为 有 什么 新 的 功能 可 以 避 
免 衡 单 的 连接 而 操心 。 事 实 上 ，3SQL 语 言 的 其 他 一 些 方 而 还 是 很 强大 的 ， 因 为 它 提 供 了 如 此 
多 的 形式 而 且 其 中 的 许多 形式 还 有 待 于 进一步 地 探讨 。 为 了 帮助 大 家 解决 这 些 问 题 ， 本 章 后 
面 有 一 节 专 门 列 出 了 完整 的 Select 语 句 遂 用 形式 ， 以 便 你 对 SQL 所 允许 的 所 有 形式 进行 彻底 的 
搜索 。 而 且 ， 我 们 在 正文 和 习题 中 都 指明 了 一 种 新 的 SQL 形 式 什 么 时 候 为 该 语言 增加 了 额外 
的 摘 述 能 力 以 太 什 么 时 候 没 有 。 雷 运 的 是 ， 我 们 需要 学 习 的 概念 集合 不 是 无 限 的 ， 尽 管 在 最 
开始 的 时 候 它 似乎 大 得 出 奇 。 


3.5 _ UNION 运算 符 和 FOR ALL 条 件 


3.3 节 介绍 了 SQL Select 语 句 实现 关 系 代 数 投影 、 选 择 和 第 卡 儿 积 运算 的 方法 。3.4 节 详 述 
了 搜索 条 性 的 功能 ， 给 出 了 许多 用 于 创建 包 全 子 查询 的 搜索 条 件 的 新 谓 间 ， 并 将 模拟 关系 运 
算 符 差 和 交 的 方法 加 进 了 Select 语 名 的 技巧 库 。 在 这 一 节 里 ， 我 们 将 看 到 如 何 用 SQL 来 实现 并 
(union) 和 和 除 (divisiom) 运 算 (这 些 是 5QL 的 新 特性 )。 这 样 ，SQL 就 完成 了 对 整个 关系 运算 符 集 
侣 的 模拟 ， 所 以 我 们 现在 似乎 已 具备 了 用 SQL 形式 来 表达 任何 关系 代数 查询 的 能 力 。 尽 管 如 
此 ， 下 一 节 仍 然 会 介绍 一 些 执行 交 、 差 以 及 特殊 连接 运算 的 新 SQL 运 算 和 从 

1. UNION 运 算术 

为 了 提供 关系 代数 的 UUUNION 运 算 符 ) 运 算 ，SQL 需 要 一 种 新 的 Select 人 向 法 。 图 3-9 的 
UNION 句 法 可 被 任意 数目 的 子 查询 { 见 图 3-5 所 列 的 语法 )， 反复 使 用 ， 只 要 它们 所 产生 的 表 者 


是 可 荧 容 的 。 
Subquery UNION LALL] Subquery 


图 3-9 子 查询 的 UNIOQN 形 三 


在 选用 UNION 运 算 符 的 时 候 ，、 我 们 必须 三 思 而 后 行 。 当 前 的 许多 产品 都 允许 在 完整 的 
Select 诸 名 中 使 用 UNION， 但 未 允许 在 包含 子 审 询 的 谓词 中 使 用 。 也 就 是 说 ， 在 图 3-6、3-7 和 
3-8 的 IN 讲 启 、 量 化 比较 谓词 以 及 EXISTS 计 词 所 包含 的 子 查询 里 ,我们 不 能 使 用 子 查询 的 
UNION 形 式 。Core SQL-99 人 允许 在 任何 定义 了 了 于 查询 的 地 方 使 用 UNION。PB2 UDPB 现 在 也 多 
许 这 么 做 ， 而 其 他 产品 可 能 也 将 紧 随 其 后 。 


一 
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例 3.5.1 ”建立 一 个 包含 了 顾客 所 在 的 或 者 代理 商 所 在 的 或 者 两 者 皆 在 的 城市 的 各 单 。 这 
可 以 通过 干 面 的 Seleet 语 句 来 实现 : 


select clity trom customers 


union select city from agents: 
可 以 想象 : 如 果 一 个 城市 同时 满足 了 上 述 两 个 条 件 ， 我 们 就 希望 它 在 结果 中 显示 两 次 
《这 样 的 结果 人 包 全 了 更 多 的 信息 )。 在 那 种 情况 下 ， 我 们 使 用 下 列 语句 ， 


setect city From customers 
union all select city from agents: 


注意 ， 从 customers 和 agents 册 表 的 箔 卡 儿 积 中 检索 单个 city 列 的 查询 方法 在 这 里 是 
行 不 通 的 。 

同 以 往 -~- 样 ,我 们 可 以 对 任何 表达 式 加 括号 ， 而且 当 涉 及 到 的 子 查 询 数 日 关于 或 等 于 3 时 ， 
括号 可 被 用 来 判别 UNION 和 UNION ALL 的 运算 顺序 。 比 如 ， 考 虑 查阅 


(select City from customers 
union select city from agents} 
unfon all select city from products: 


此 时 ， 如 果 Chicogc 同 时 出 卉 于 customers 表 和 products 表 但 不 出 现在 agents 表 中 , 它 
将 在 结果 中 显示 两 次 。 但 如 果 以 如 下 方法 移动 Select 语 铝 中 的 插 愉 位 置 ， 它 就 不 再 显示 两 次 。 


spelect city from customers 
UNnion tselect city from agents 
union all select city from productsy}: 加 


2. 除法 : SQL "FOR ALL …” 和 条件 
傻 定 我 们 需要 找 出 通过 件 在 New York 的 所 有 代理 调 订 了 货 的 顾客 的 cidq 值 。 在 关系 代数 
中 此 查询 可 用 下 面包 含 了 除法 的 表达 式 来 解 出 ; 


ORDERSECid, aid] DIVIDEBY CAGENTS where city 一 “Mew Tork"}[aid] 


不 训 的 是 ， 在 SQL 中 没有 等 价 的 PIVIDEBY 运 算 符 ， 而 且 我 们 也 不 打算 像 处 理 UNION 那 样 立 
即 引 入 一 种 特殊 的 新 SQL 语 法 。 注 意 此 DIVIDEBY 查 询 不 能 用 诸如 <ALL, <=ALL, =ALL 之 类 
的 量化 谓词 形式 来 构造 ， 因 为 在 住 在 New York 的 代理 商 的 属性 上 根本 就 没有 出 现任 何 比较 操 
作 。 因 此 ， 我 们 不 得 不 使 用 一 种 全 新 的 SQL 方法 来 实现 该 查询 。 这 种 方法 由 于 其 内 在 的 难度 ， 
所 以 值得 我 们 花 较 大 的 篇 师 来 详细 介绍 。 

此 方法 以 数理 脖 辑 和 数学 证 明 概念 为 基础 。 我 们 的 介绍 从 这 样 的 问题 开 妈 : 如 何 证 明 或 
反 矣 所 有 住 在 New York 的 代理 商 部 为 处 在 某 个 范围 变量 c 所 指定 的 行 上 的 特定 顾客 c .cidiJ 了 
货 ? 显然 ， 我 们 可 以 通过 找 出 反例 来 反 竖 ， 即 有 一 个 住 在 New York 的 代理 商 没 有 为 c. cid 订 
货 。 如 果 我 们 把 该 代理 商 命名 为 a .aid， 我 们 可 以 将 此 反例 表示 成 SQL 的 搜索 条 件 〔 为 了 便 
于 引用 我 们 将 它 标注 为 conal ， 尽 管 这 不 是 规范 的 SQL 语法 ): 

condl: Aacity = New York’ and 


not exists Cselect * from orders x 
where Xi = ccid and x.aid 一 .Bi 


该 条 件 说 明 a .aidq 所 代表 的 代理 商 住 在 New York， 但 在 orders 表 中 却 没 有 连接 c .cia 和 
a .aiqd 的 行 。 也 就 是 说 ，c .cid 没 有 通过 a .aid 订 货 。 
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现在 来 证 明 所 有 住 在 New York 的 代理 商 确 实 都 为 c,cida 所 代表 的 特定 顾客 订 了 货 ， 我 们 
必须 写 出 能 保证 刚才 构造 的 那 种 反 鲍 不 存在 的 条 件 。 也 就 是 说 ， 我 们 要 确保 没有 代理 商 
a .aid 能 使 cond1 为 真 。 该 条 件 也 可 以 被 表示 成 搜索 条 件 ， 这 里 称 之 为 cond2: 

cond2: not exists tselect * From agents a where condl) 

或 者 写成 完整 的 形式 : 
cand2: not exists {select * from agents a where a.ctty = New York" 


and not exists fselect * from orders 其 
where 其 -Ci 一 站 和 End x.aid = 3.8id)) 


这 是 一 个 非常 难 掌握 的 条 件 ， 所 以 我 们 需要 再 花 时 间 回 顾 -- 下 cond2 ， 它 的 内 在 逻辑 是 : 
不 存在 这 样 一 个 住 在 New York 的 代理 商 a .aid， 他 没有 为 c .cid 订 货 (c.cid 中 的 范围 变 其 
c 在 这 里 还 没有 被 定义 )。 当 然 ， 这 就 意味 着 住 在 New York 的 所 有 代理 商都 为 c .cid 订 了 货 。 
如 果 你 也 同意 cond2 有 这 样 的 含义 ， 那 我 们 就 已 经 达到 目的 了 ， 因 为 现在 所 要 做 的 只 是 检索 
满足 cend2 性 质 的 所 有 cidqd 值 。 下 面 的 例子 综合 了 上 面 所 有 的 论述 . 


例 3.5.2 求 出 通过 住 在 New York 的 所 有 代理 商 订 了 货 的 丘 客 的 ciq 值 。 通 过 上 述 讨论 ， 


stelect cid from customers where cond?: 
或 者 写成 完整 的 形式 ; 
select c.cid from customers cc where =- select c.cid if,.,., 
not exists (setect = from agents a -- there 15 no agent a.aid 
Where a.city = "New ToOrk” and diving in New Tork 
not exists select * from Orders x -- .here no order row 


where XxX.ctd = tC.tid 
and x,Bld = a.81d})): -OnnNnects .cid and a.31d 


此 查 调 应 返回 表 : 


| 





我 们 非常 能 理解 那些 第 一 次 过 到 如 此 复杂 的 符号 抽 辑 结构 的 读者 的 心情 。 当 然 ， 这 是 
SQL 查询 中 最 难 的 概念 。 要 想 熟 练 地 运用 这 种 方法 就 必须 采取 有 组 织 的 循 太 新 进 的 步骤 ， 千 
担 每 一 步 的 原理 直到 其 中 所 包含 的 每 一 个 概念 都 诛 深 地 扎根 于 脑海 。 

如 果 所 面临 的 查询 要 求 被 检索 的 对 和 象 集合 必须 符合 某 个 带 有 “所 有 ”这 类 关键 词 的 条 件 ， 
我 们 就 按照 下 列 步 又 来 执行 : 

1) 为 要 检索 的 对 象 命名 并 考虑 如 何 用 英文 来 表述 要 检索 的 候选 对 象 的 一 个 反例 。 在 该 色 
例 中 ， 前 面 提 到 的 “所 有 ”对 象 中 有 至 少 一 个 对 象 不 符合 规定 的 条 件 。 

2) 建立 Select 语 句 的 搜索 条 件 以 选 出 步骤 1 所 创建 的 所 有 反例 。( 步 又 1 和 2 必定 会 引用 来 自 
外 部 Select 语 名 的 对 象 ， 所 以 我 们 要 在 如 何 用 这 些 外 部 对 象 所 在 的 表 来 引用 它们 这 - -问题 上 表 
现 出 一 定 的 灵活 性 。) 

3) 建立 包 合 步 又 2 所 创建 的 语句 的 搜索 条 件 ， 说 明 不 存在 上 上 面 定义 的 那 种 反 策 。 这 里 将 社 
及 到 NOT EXISTS 请 启 。 
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4) 用 步骤 3 的 搜索 条 件 来 建立 最 终 的 Select 语 句 ， 检 索 所 期 望 的 对 象 。 


例 3.5.3 求 出 住 在 New York 或 Duluth 并 订购 了 价格 超过 一 美元 的 所 有 产品 的 代理 商 的 
aia 值 。 为 了 能 进行 上 述 步 又 1， 我 们 用 a .aia 来 代表 满足 题 意 的 代理 商 ( 伯 为 了 对 范围 变 其 
保持 灵活 性 ， 这 里 把 它 表示 成 ? .aia 以 允许 包 禽 除 asents 以 外 的 其 他 表 ) 并 构造 反例 : 

"There is a product eosting over a dollar that is not ordered by ?.aid.” 


接着 (步骤 2 )， 表 述 收 集 ?.aid 所 有 友 例 的 Select 语 句 的 搜索 条 件 : 


Condl: select pid from products p where price > 1.00 and not exists 
(select * from orders x Where x.pid = p.pid and x.aid = ?.aid} 


按照 步 又 3、 建 立 表示 这 类 反例 不 存在 的 人 条件: 


Onde not exists (select pid from products p where 
price > 1,00 and not exists Cselect * from orders x 
Where x.pid = P.pfd and x.aid = ?.aid)) 


最 后 ,按照 步骤 4， 建 立 最 终 的 Select 条 件 。 注 意 ， 这 里 与 例 3.5.2 不 同 的 是 步骤 3 仅 建 立 了 了 
要 检索 的 代理 商 所 必须 满足 的 条 件 之 …: 


select aid from agents a 
where ta.city = New York’ or a.city = Duluth") 
and not exists {select p.pid from products p 
Where p.price > 1,00 and not exists (select * from orders x 
where xpid = ppid and x.aid = a.aid)): 


该 Select 语 句 的 结果 如 下 表 上 所 示 : 


0 | 

上 面 最 先 出 现 的 条 件 (a,city = 'New York ' or a.city ='Duluth ') 被 放 入 
括号 是 因为 AND 连 接 符 出 OR 连 接 符 具有 更 高 的 优先 级 ， 而 自然 的 优先 级 顺序 将 产生 违背 我 们 
意愿 的 分 组 ， 即 ,. .where a.city = 'New York ' or la.city -= 'Duluth 
and not exigts ...}。 这 样 得 到 的 管 案 为 : 





注意 上 面 介 绍 的 步骤 序列 通常 会 产生 如 下 所 示 的 舱 套 子 查 询 对 : 

salect ... Where not exists select ,., where not exists tselect ... 1}; 

如 果 S$QL 的 设计 者 们 能 像 引 人 EXISTS 谓 词 那样 引 人 FOR ALL 谓 词 ， 那 就 会 方便 许多 。 但 
不 老 的 是 他 们 并 没有 那么 做 。” 这 意味 着 我 们 需要 使 用 已 存在 的 其 他 条 件 运 算 符 来 创建 等 价 


白 ”FOR ALL 量 启 曾 被 建议 用 在 标准 ANSE SQL 中 ， 但 该 建议 未 被 采纳 。 注 意 在 数理 多 辑 中 ，FOR ALL 运 算 符 ， 
( 和 EXISTS 运 算 符 (3 了) 被 认为 有 是 量词 而 不 是 谢 词 。 我 们 使 用 谓词 这 个 术语 是 为 了 遵从 目前 的 ANSI SQL 标 
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的 亩 间 。 熟悉 数理 逆 辑 的 计 者 都 知道 ， 下 列 重 言 式 是 使 用 两 深 NOT EXISTS 娟 词 这 种 方法 的 
理论 依据 : 
[3.5.1] Vz (dy Plz y) ) © dz (dy plz, yi | 


如 果 用 文字 重 述 [3.5.1]， 下 面 两 和 名 话 是 等 价 的 ;: (1) 对 所 有 的 z:， 丰 在 y 使 得 依赖 于 z 各 y 的 
语句 p(z, 站) 为 真 ，( 2) 对 于 某 个 z， 恒 得 不 存在 使 p(z, 四 为 真 的 y， 这 一 命题 次 假 。 在 例 3.5.2 中 ， 
z 是 agents 直 中 city 值 为 New York 的 行 ; y 是 oraers 表 中 的 行 ; 而 plz, 办 则 表示 位 于 行 z 王 的 
代理 商 通过 行 y 所 代表 的 订货 记录 连接 到 顾客 c 上 ( 位 于 该 子 查询 之 外 )。 考 虑 语句 [3.5.11 的 最 
性 方法 是 ， 左边 的 形式 是 我 们 所 希望 创建 的 FOR ALL 谓 词 ， 而 右边 的 形式 则 如 例 3.5,2 阐 述 的 
那样 表示 上 反 便 的 不 存在 。 注 意 重 言 式 [3.5. 让 右 闸 的 表达 式 包 会 了 两 个 诺 套 的 NOQT EXISTS 请 词 ， 


例 3.5.4 ” 找 出 订购 了 产品 p01 和 和 价格 越过 一 美元 的 所 有 产品 的 代理 商 的 aid 值 。 注 意 对 在 
练习 3.2.I 中 被 导入 示例 数据 库 的 图 2-2 的 CAP 表 而 言 ， 该 查询 的 结果 是 一 个 空 表 。 但 我 们 仍 有 
必 鉴 创建 正确 的 Select 语句 ， 因 为 一 旦 CAP 数 据 库 的 内 容 有 了 变化 ， 结 果 很 可 能 就 会 变 为 非 
空 。 我 们 对 例 3.5.1 的 查询 语句 略 作 改 动 便 能 得 到 符合 题 意 的 查询 ， 因 为 在 上 例 中 我 们 检索 的 
是 住 在 New Yerk 或 Duluth 并 订购 了 价格 赵 过 一 美元 的 所 有 产品 的 代理 商 ， 这 里 只 需要 定义 原 
题 所 规定 的 第 一 个 条 件 ， 而 第 二 个 条 件 则 可 以 原封 不 动 地 照搬 上 上 例 解 法 中 的 FOR ALL 条 件 : 


$lect Aid fF agents a where a,.aid in 
(select aid from orders where pid = ‘pul'’ 
and not exists {select Pp.pid from PrOdycts op 
where p.price > 1.00 and not exists (select * from orders x 


where x.pid = Pp.pid and x.aid = a.aid)}; 


几 下 列 语句 来 表示 第 一 个 条 件 会 显得 更 加 自然 : 
select vy.atd from orders y where y.pid = "pol and . .. 
这 意味 着 FOR ALL 条 件 内 部 所 引用 的 范围 变量 a 必 须 被 修改 : 


select y.aid from orders 了 Where ¥y.pid ~ "pbl” and 
not exists (selerct ppid from products p 
where p.price > 1.00 and not exists Cselect * from orders x 
where x.pid = ppid and x.Aaid = y.aid)}}: 


回顾 建立 FOR ALEL 和 条件 的 四 步 过 程 中 的 步 又 2， 我 们 说 过 该 步骤 所 创建 的 条 件 “ 必 定 会 引 
用 来 自 外 部 Select 语 名 的 对 象 ， 所 以 我 们 要 在 如 何 用 这 些 外 部 对 象 所 在 的 表 来 引用 它们 这 一 问 
题 上 表现 出 一 定 的 灵活 性 ”这 里 a .aid 必 须 变 成 y .aid 就 是 这 种 情况 的 一 个 例 于 。 国 

例 3.5.5 “” 找 出 具有 下 列 性 质 的 顾客 的 cia 值 : 如 果 感 客 c006 订 购 了 某 种 产品 ， 那 要 检索 
的 顾客 也 订购 了 该 产品 。 如 何 建 立 一 个 Select 语 句 来 满足 该 请 求 不 是 一 日 了 然 和 的 ， 而 二 如 果 不 
是 在 讲述 如 何 构 造 FOR ALL 条 件 的 章节 中 出 现 沪 问题 ， 我 们 会 感到 更 加 财 惑 。 此 向 肿 必 须 按 
照 改 写 以 后 的 语句 来 轧 考 。 原 题 中 的 请 求 可 被 改写 成 ; 找 出 订购 了 所 有 被 顾客 c006 订 购 的 产 
品 的 顾客 的 cid 值 。 我 们 仍 按 上 面 介 绍 的 步骤 来 求解 。 根 据 步 绎 1， 我们 称 c . cid 是 符合 题 意 
的 顾客 并 用 英文 构造 反例 : 


*Thara is a product ordered by customer c006 that is not ordered by c .cid." 


现在 我 们 把 它 表 述 成 搜索 条 件 ， 这 是 步骤 2。 我 们 将 被 c006 订 购 的 产品 命名 为 p.pid， 伍 
仍 保 持 其 灵活 性 : 
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condl: ppid in tselect pid from orders x Where xX.cid = "cAONG") 
afnd not erists Cselect *£ fFom SFdUers 和 
where y.pid = p.pid and y.cid = t.cid} 


遵照 步骤 3， 建立 表示 这 种 反例 不 存在 的 条 件 : 


cond2: not exists (selerct Pp.pid from products p 
where p.pid in select pid from orders x 
where x.cid 一 co0O06' 1 and 
not exists {select * from orders y 
where y.pid = p.pid and y.cid = c.cid)) 


最 后 ， 根 据 步 又 4， 建 立 最 终 的 Seleet 条 件 : 


seleet cid from customers ec 
where not exists (select ppid from products p 
where pp.pid in tselect pid from orders Xx 
Where X.cid = 'cON6'} and 
not exists tselect * from orders vy 
where y.pid = ppid and y.cid = ct.cid}}: 


该 Seleet 语 钉 的 一 个 明显 的 变 悼 是 
select cid from customers 工 
whare not exists {select z.pid from orders z 
where 了 .Ci = “CANB' and 
not exists (select * trom orders y 
Where y.pid = z.pid ard ycid = ce,cid)}); 


结果 如 下 表 所 示 : 





经 过 充分 的 练习 ， 在 一 般 情 况 下 将 FOR ALL 条 忻 表 述 成 反例 不 存在 并 由 此 立即 建立 所 需 
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的 SQL 语句 已 成 为 可 能 。 我 们 通常 可 以 认为 最 内 层 子 查询 所 要 做 的 就 是 在 crqers 表 中 选 出 连 


接 外 层 Select 和 子 查 询 的 行 。 


例 3.5.6 找 出 被 所 有 住 在 Duluth 的 顾客 订购 的 产品 的 bid 值 。 我 们 要 表达 的 意思 是 不 存在 


没有 订购 我 们 要 检索 的 piq 并 住 在 Puluth 的 顾客 。 


select pid from Products p 
where not exists 


[select c.cid from customers t -- .there is no customer 
Where cefty = Duluth’ "in Duluth 
dn not extfsts 
tselect * From orders x 7 where TO row in orders 
Where x,pid = p.pid -- .connects 局 .pf 
Bd xX.Cid = Cc.cid))}; -dd 


-~ Retrieve product p.pid 7f 


现在 ， 我们 能 得 出 结论 : SQL 有 能 力 计算 关系 代数 所 能 计算 的 一 切 。 这 一 结论 的 公认 术 
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语 是 : SQL 是 关系 完备 的 【telationally complete )。 我 们 在 下 面 儿 节 里 将 看 到 ，SQL 在 功能 上 
超过 了 关系 代数 。 现 在 是 一 个 停 下 来 完成 本 章 末 尾 开 头 一 批 习题 (3.1~3.7) 的 好 上 时机， 这些 习 
题 反 蜡 了 到 目前 为 目 已 介绍 的 所 有 Select 语 句 特征 。 


3.6 高 级 SQL 语 法 


从 3.1 到 3.5 节 ， 我 们 介绍 了 实现 所 有 关系 代数 查询 所 必需 的 SQL 功 能 。 这 几 节 所 介绍 的 基 
本 SQL 语法 ， 除 极 个 别 的 一 些 以 外 ， 都 在 几 个 主要 的 数据 库 产 品 中 得 到 了 实现 。 这 一 节 将 介 
绍 一 些 高 级 SQL 运算 符 ， 它 们 并 不 统一 适用 于 所 有 的 数据 库 系统 而 及 不 是 Entry SQL-92 的 一 部 
分 。 但 另 一 方 而 ， 这 些 运算 符 又 几乎 都 在 Core SQL-99 中 ， 所 以 很 可 能 会 出 现在 未 来 的 数据 库 
产品 中 。 本 节 将 介绍 的 所 有 语法 部 不 属于 基本 SQL。 你 必须 仔细 阅读 以 便 丁 解 哪 些 功能 是 你 
正在 使 用 的 数据 库 产品 所 支持 的 。 大 多 数 的 高 级 语法 只 不 过 是 为 我 们 已 见 过 的 某 些 关系 查询 
提供 了 一 种 新 的 解法 。 尽 管 如 此 ， 还 是 有 一 些 新 增加 的 特性 极 大 地 增强 了 SQL 的 能 力 ， 比 如 
在 FROM 子 句 中 实现 查询 的 特性 。 

我 们 首先 说 明 模 拟 关 系 运算 交 和 差 的 SQL 运 算 符 ， 以 后 还 会 介绍 一 种 针对 婴 现 在 FROM 子 
各 里 的 Select 语 名 的 新 语法 ， 包 括 多 种 连接 运算 符 ， 

1. 高 级 SQL 中 的 INTERSECT 和 EXCEPT 和 这 算 衬 

为 了 模拟 关系 代数 的 站 (INTERSECT) 和 -~ (DIFFERENCE) 操 作 ，Full SQL-92 和 SQL-99 提 
供 了 两 个 新 的 运算 符 : INTERSECT 和 EXCEPT。 这 些 运算 符 的 使 用 方法 与 图 3-9 所 示 的 
UNION 用 法 是 一 样 的 。 事 实 上， 图 3-9 所 显示 的 是 Entry SQL-92 语 法 .。 图 3-10 则 显示 了 一 个 更 
大 的 Ful SQL-92 语 法 的 子 集 ， 包 含 了 当前 一 些 产品 所 支持 的 集 侣 运算 UNION 、INTERSECT 
和 EXCEPT 的 用 法 。 在 所 有 这 些 运算 中 ，Core SQL-99 对 UNIGN[ALL] 和 EXCEPT 做 出 了 规定 。 


subquery TUNION [ALL]| INTERSECT [ALL] | EXCEPT [ALL] subqueryj 


图 3-10 包 会 UNION 、INTERSECT 和 EXCEPT 的 高 级 SQL 于 查询 形式 


图 3-10 说 明 两 个 子 查 询 能 通过 UNION 、INTERSECT 和 EXCEPT 运 算 符 来 连接 以 生成 一 个 
新 的 子 查询 ( 它 既 可 以 被 看 做 一 个 完整 的 Select 语 句 也 可 以 被 当成 子 查 鹿 而 放 在 某 些 谓词 中 )。 
这 个 结果 子 查询 随后 又 可 以 递归 地 替换 图 3-10 形 式 中 的 任何 :个子 查询 ， 这 样 ， 任 意 数目 的 
子 查询 都 能 通过 这 些 运算 符 连 接 起 来 。 同 以 往 一 样 ， 这 里 可 以 用 括 寻 来 保持 运算 次 序 并 消除 
二 义 性 。 如 果 把 表 看 做 行 的 集 台 ， 那 INTERSECT 运 算 符 的 含义 是 不 言 自 明 的 ， 而 EXCEPT 运 
算 符 则 模拟 关系 代数 的 DIFFERENCE 运算 。 

我 们 已 从 对 结果 包含 一 个 公共 行 的 两 个 子 查询 进行 UNION ALL 操作 的 例子 中 看 到， 最 终 
的 UNION 结 果 将 包含 两 个 相同 的 行 。 这 从 另 一 个 侧面 说 明 : 关键 词 ALL 会 促使 UNION 考 虑 重 
复 行 的 数目 。 对 于 同样 的 两 个 子 查询 ， 两 次 UNION ALL 运 算 的 结果 会 包含 三 个 重复 行 ， 依 此 
类 推 。 考 虚 对 两 个 子 查 询 Q1 和 Q2 执 行 INTERSECT ALL 运 算 : 

Qi INTERSECT ALL DZ 

由 于 查询 QI 和 村 Q2 本 身 可 能 都 是 任意 次 UNION ALL 运 算 的 结果 ， 所 以 Ql 中 可 能 有 三 个 重复 
行 而 Q2 中 可 能 有 两 个 与 之 相 匹 配 的 重复 行 。 此 时 ，INTERSECT ALL 的 结果 会 同时 考虑 两 边 的 
重复 行 数 日 。 在 这 种 情况 下 ， 最 终 的 结果 将 包含 两 个 这 样 的 重复 行 { 同一 重复 行 在 两 个 操作 数 
中 的 最 小 数目 一 一 这 与 我 们 希望 那些 个 出 现在 INTERSECT 两 边 任 一 子 查询 中 的 行 在 最 终结 果 
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中 的 行 数 为 零 的 想法 是 一 致 的 )。 另 一 方面 ， 如 果 关 键 房 ALL 被 省 略 卫 ， 那 么 我 们 仅 认 为 上 面 
提 到 的 那 一 行 同时 在 Q1 和 Q2 中 【 行 的 数 虽 只 可 能 为 0 或 1 )， 所 以 这 一 行 会 出 现在 结果 中 。 
同样 ，EXCEPT ALL 送 算 符 也 会 冶 虚 重复 行 的 数 日 : 

Ql EXCEPT ALL AQ2 
如 果 @@I1 的 结果 包含 了 -个 相同 的 行 且 中 2 的 结果 也 包含 了 两 个 与 之 相 匹配 的 行 ， 那 EXCEPT 
ALL 子 查 谢 的 结果 将 包含 一 个 这 样 的 行 。 也 就 是 说 ， 在 EXCEPT ALL 的 结果 中 ， 同 一 行 的 出 
现 次 数 将 是 该 行 在 Ql 中 的 出 现 次 数 减 去 它 在 Q2 中 的 出 现 次 数 (但 最 小 值 应 为 零 )。 如 果 关 键 
词 ALL 被 省 略 了， 那 上 面 提 人 色 的 重复 行将 被 看 做 同时 在 Q1 和 Q2 中 出 现 了 一 次 ， 所 以 它 不 会 出 
现 在 结果 中 。 注 意 Core SQL-99 只 包含 了 简单 的 EXCEPT 而 没有 包含 EXCEPT ALL。 

如 果 两 个 由 子 查询 计算 而 得 的 表 具 有 相间 的 列 数 而 且 它 们 在 Create Table 语 名 中 从 不 到 右 
的 列 数据 类 型 是 兼容 的 ， 那 么 它们 就 能 成 为 UNION、INTERSECT 或 EXCEPT 运 算 的 操作 数 。 
比如 ， 次 型 为 char (5) 的 列 可 以 和 类 型 为 cnar {10) 的 列 进行 比较， 该 列 在 最 后 的 结果 中 
将 拥有 时 通用 的 数据 类 型 char (10)。 

INTERSECT 和 EXCEPT 运 算 符 并 没有 增强 Select 语 句 的 能 力 (我 们 已 经 能 用 NOT IN 利 
NOT EXISTS 谓 词 来 实现 这 些 操作 )。 但 :关键 词 ALL 了 确实 增强 了 Select 诸 句 的 能 力 ， 尽管 它 可 
能 有 用 也 可 能 没 用 。 

例 3.6.1 回顾 例 3.4.11 中 的 请 求 : 求 出 既 订 购 了 产品 p01 羡 订 购 了 产品 p07 的 和 颖 客 的 cigd 值 。 
有 好 几 种 查询 形式 可 以 解 块 该 问题 ， 


select distinct cid from orders 其 
where pid = PO and exists (select * from orders 
where cid = x.cid and pid -= pO7'): 


以 及 
select distinct cid from orders x 
Where pid ~ pOl' and cid in {select cid from orders 


where pid 一 “pO7”) 


然而 ， 不 使 用 子 查询 也 可 以 达到 这 -有 此 的。 


select distincet weftd From Srders x, orders y 
where x.pid = "PO and x,cid = ycid snd ypid = pO": 


新 介绍 的 INTERSECT 运 算 符 为 我 们 提供 了 另 一 种 解法 : 


Select cidg from drders Hhere pid = pOL' 
intersect select cid from urders where pid = “pO? ': 


下 面 ， 我 们 用 一 个 例子 来 说 明 EXCEPT 谓 词 本 身 并 没有 给 Select 语 句 增 加 新 的 能 力 。 


例 3.6.2 检索 没有 通过 代理 商 a05 订 货 的 所 有 顾客 的 名 字 。 此 查询 可 以 用 新 引信 的 
EXCEPT 萌 词 来 完成 : 


select c,cname from customers ce 
exCent 
select cc.cname From customers ce, Orders x 
where C.cid = x.cid and x.aid = a05", 
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但 我 们 在 例 3.4.12 中 已 给 出 了 一 种 不 同 的 解法 。 在 这 种 解法 中 ，NOT EXISTS 谓 问 可 被 蔡 换 成 
NOT IN 和 <>ALL : 
splect c.chname from customers oc 
nhere not exists select *£ from orders xX 
Where ccid = Xeid and x.ald = ‘a05"); 
还 有 许多 数据 库 生 产 厂商 没有 实现 INTERSRECT 种 EXCEPT。X/Open 标 准 支持 UNJON|ALL] 
但 不 支持 INTERSECT[ALL] 或 EXCEPT[ALL]。'( 参见 本 章 结 尾部 分 “推荐 读物 ”中 的 X/Open 标 
准 以 及 其 他 文献 )，ORACLE 提 供 了 UNION、UNION ALL、 INTERSECT 和 MINUS (EXCEPT 
的 别名 )， 但 不 支持 INTERSRCT ALL 或 MINUS ALL。DB2 UDB 版 本 5 实现 了 所 有 这 些 形式 : 
{UNION | INTERSECT | EXCEPT} [ALL]。INFORMIX 版 本 9.2 支 持 UNION [ALL]. 
2. 高 级 SQL 中 的 连接 形式 
在 ANSI SQL-89 标 准 中 ，FROM 子 名 是 非常 基本 的 ， 它 的 形式 如 下 所 二， 
FROM tablename [corr_name] {. tablename Teorr_namel...} 
Entry SQL-92 沿 用 了 这 一 形式 。 队 ORACLE 以 外 的 所 有 主要 产品 都 扩展 了 该 形式 以 允许 
关键 户 AS 出 现在 相关 名 前 面 ， 这 种 扩展 形式 已 显示 在 图 3-5 中 并 被 当 作 基本 SQL 来 使 用 。 


FROM tabiaename [CAS] corr name] {. tablename [[AS] corr_name}...} 


但 如 图 3-11 所 示 ，Full SQL-92 和 SQL-99 又 进一步 扩展 了 这 种 语法 -。 留 3-11 从 定义 - :个 被 称 为 
cableref 的 通用 形式 开始 ， 然 后 根据 它 来 定义 FROM 子 句 〈 只 要 在 FROM 后 而 紧 跟 由 逗 导 分 
隔 的 tableref 序 列 即 可 }。 我 们 要 上 青 一 次 提 根 你 : 大 多 数 疝 用 DBMS 产 品 还 不 支持 图 3-11 所 
显示 的 滞 法 。 我 们 相信 图 3-11 所 描述 的 语法 将 来 会 在 弧 大 多 数 数据 库 产品 中 得 到 实现 ,但 所 
有 的 数据 库 系 统 都 不 可 能 完全 遵循 这 种 语法 。 人 和 仔细 陪读 木 文 以 明确 哪些 产品 具体 支持 网 3-11 
中 的 哪些 特征 ; 或 者 查阅 附录 C， 那 里 列 出 了 针对 特定 DBMS 产 品 的 SQL 语法 。 


tableref::= tablename {fAS] corr_name [tcolname {. colname ...117]1 --simple form 
| tsubquery}y [ASY corr_ name [icolname +{, colname...}}] - -SUbquery as table 
| tableref] [CINNER | {LEFTIRIGHT|FULL}Y [OUFER]] JOIN tablerefe --join forms 


ON search condition | USING tcolname {, colname ...}}] 


FROM Cilause :1:= FROM tableref {, ¢#01eref...} 





图 3-11 SQL-99 对 Lablere 的 递归 定 多 以 站 使 用 tablereE 形 式 的 FROM 了 名 


注意 图 3-1] 对 tableref 的 定义 是 递归 的 ， 按照 该 定义 形成 的 Lableref 对 和 象 随 后 可 被 递 
归 地 用 于 该 形式 中 任何 tableref 对 象 所 在 的 位 置 。 图 3-11 中 的 任何 FROM 子 名 形式 都 可 以 被 
子 查询 【或 Select 语 可 ) 使 用 。 在 JOIN 形 式 的 外 围 可 以 使 用 括号 、 

图 3-11 所 提供 的 第 一 项 SQL 新 特性 体现 在 tableref 定 义 的 第 一 行 ， 即 介 许 用 带 括号 的 序 
列 [(coIname]{, colname...} ) | 来 为 从 一 个 表 ( FROM 子 杀 中 的 表 ) 中 检索 到 的 所 有 列 重新 命名 。 
如 时 使 用 了 这 样 的 序列 ， 那 么 EROM 子 铝 所 在 的 Seleet 语 名 的 选择 列表 也 必须 使 用 这 些 列 名 。 
在 第 二 行 ，tableref 可 以 是 -个 子 查 调 ， 这 使 得 我 们 能 够 在 一 个 子 查询 或 Select 语 句 中 自由 
地 检索 由 另 一 个 子 查询 提供 的 数据 。 与 第 一 . 行 不 同 的 是 ， 第 二 行 中 的 相关 各 是 必 不 可 少 的 ， 
因为 我 们 需要 一 个 表 名 以 便 引 用 由 子 查 询 生 成 的 表 。 再 强调 一 下 ， 第 二 行 中 的 列 名 集 是 可 选 
的 ， 它 提供 了 -- 种 为 子 查询 选择 列表 所 包含 的 每 个 元 素 指定 一 个 列 别名 的 方法 。 

尽管 Select 语 铝 的 结果 本 上身 就 是 一 张 表 ,但 只 有 Full SQL-92 和 SQL-99 (在 扩展 特性 中 ) 
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多 许 一 个 子 查询 出 现在 另 一 个 子 查 询 的 FROM 子 句 中 。 图 3-11 的 FROM 后 务 能 反复 出 现任 意 次 
tableref， 这 意味 着 我 们 能 按 顺 序 麟 出 多 个 不 同 种 类 的 tableref 并 且 像 以 往 对 待 一 般 的 
表 那 样 对 所 有 这 些 kablereft 做 笛 卡 儿 积 。 我 们 所 涉 上 太 的 一 些 数据 库 系 统 日 前 还 不 允许 在 
FROM 村 名 中 出 现 子 查询 ， 比 如 ，INFORMIX DS 版 本 9.2 就 不 支持 这 种 用 法 ， 而 ORACLE 版 
本 8 和 DB2 UDB 版 本 5 则 允许 这 样 做 然而 ,目前 的 ORACLE 婚 不 支持 tableref 形 式 中 
corr_name 之 后 的 [ {colname{,， colname...})] 也 不 支持 corr_name 之 前 的 关键 词 
AS。 作 为 已 命名 的 扩展 特性 ，FROM 后 面 的 于 查询 是 Full SQL-99 的 一 部 分 ; 也 就 是 说 ， 它 不 
是 Core SQL-99 的 一 部 分 。 

例 3.6.3 ”检索 对 同 汪 产品 至 少 订 购 了 两 次 的 所 有 顾客 的 名 字 。 有 很 多 种 方法 可 以 实现 此 
查询 ， 这 里 使 用 把 一 个 子 查询 当 作 表 来 检索 的 方法 : 

select cname from tselect o.cid as spetd from orders 口 。 Drdears x where o.cid = x.cid 


a Dpid = x.pid and ,ordno < x.ordno} ¥, customers c 


where y,spPeid = c.cid: 


注意 在 该 伸 询 中 我 们 为 子 查 询 的 结果 指定 了 一 个 别名 yt 这 样 做 是 必要 的 )， 并 为 子 查 询 所 
检索 的 到 提供 了 一 个 别名 (spcid)}。 我 们 要 用 这 些 别 名 来 设 定 条 人 忻 y .spcid = c,cid, 从 


而 选 出 表 y 和 表 customers 的 箔 卡 儿 积 中 符合 条 件 的 行 。 加 
下 面 介绍 图 3-11 的 第 三 行 和 第 四 行 所 显示 的 各 种 连接 运算 符 。 大 元 数 数据 库 产品 还 没有 


在 图 3-11 的 第 二 行 中 出 现 了 关键 词 INNER， 而 且 在 关键 词 JOIN ( 不 可 省 略 ) 之 前 ， 在 
INNER 与 {LEFT | RIGHT |! FULL}】 [OUTER] 的 选择 之 间 ，INNER 是 缺 省 的 选项 。 事 实 上 ， 一 
个 INNER JOIN 就 是 我 们 原先 在 关系 代数 中 学 到 的 那 种 连接 类 型 ， 它 与 (FULL) OUTER JOIN 
的 含 光 相反 。 我 们 先 来 看 一 下 有 关 INNER JOIN 的 一 些 例 子 ， 但 这 些 和 例子 中 的 Select 语 句 都 不 
会 刻意 地 包含 关键 词 JNNER， 因 为 那 显然 是 多 此 一 举 。 

如 果 我 们 使 用 了 图 3-11 第 二 行 的 关键 词 JOINV， 那 JOIN 两 边 的 两 个 rableret 都 需要 一 个 
关子 它们 如 何 做 连接 的 说 明 ， 也 就 是 有 关 哪 些 列 要 参与 连接 的 说 明 . 在 使 用 关键 词 JOIN 的 时 
候 ， 我 们 必须 使 用 关键 间 ON 或 USING 中 的 一 个 来 指定 要 参加 连接 的 列 。ON 形 式 比 USING 形 
式 更 为 通用 ,但 USING 形 式 要 相对 简洁 一 些 。ON 形 式 还 能 处 理 一 个 连接 列 在 两 个 参与 连接 的 
表 中 具有 沫 同 的 列 名 这 种 情况 。 

当 两 个 或 更 多 个 任意 指定 的 列 要 在 ON 子 句 中 进行 比较 时 ， 我 们 称 之 为 条 件 连接 (condition 
join)。 比 如 ， 如果 有 一 个 包含 列 cityname，latitude 和 longitude 的 cities 才 ,我 们 
扔 可 以 写 : 

select cname, city, Jatitude,. longitude 

from customers 上 jotn cities x on Cc.city = X.Citynames 


例 3.6.4 检索 至 少 订 购 耳 一 件 价 格 低 于 $0.50 的 商品 的 所 有 顾客 的 姓名 。( 注意 图 2-2 的 
CAP 数 据 库 设 有 包含 满足 该 查 调 的 行 ， 但 这 显然 与 查询 本 身 无 关 。) 下 面 的 解法 是 不 正确 的 : 

{LORDERS bd PRODUCTS where price < 0.507 tq CUSTOMERS) [ename] 

这 是 因为 这 二 个 表 的 连接 要 求 及 两 个 表 的 苗 卡 儿 积 与 customers 表 太 city 央 上 模 开 
配 ， 而 这 不 是 我 们 所 希望 的 要 求 。 正 因为 这 样 ， 我们 要 在 表达 式 中 给 第 一 个 连接 加 上 限制 ， 
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如 下 所 示 : 

{CORDERS Cx {PRODUETS Where price <0.50) [pid bP CUSTOMERS}) [ename] 
但 在 SQL 中 ， 我 们 必须 显 式 地 指定 要 参加 连接 的 列 ， 而 具有 两 种 方法 可 供 选 择 。 一 种 是 用 ON 
search_eonaiciocn 形 式 来 指定 所 有 要 参加 连接 的 列 ， 从 而 实现 条 件 连 接 ， 


select distinct cname from (orders o join products p on ,Pid = p.pid)} 
join customers ¢ on ocid ~ ce.cid Where pprice < D.mD; 
或 者 我 们 可 以 通过 列 名 连接 (Column Name Joim 来 限制 要 参加 连接 的 列 ， 即 用 USING 子 句 来 
指定 两 表 中 要 参加 连接 的 列 名 集合 : 


select distinet cname from (orders join products Using Cpid}) 


joln customers Usingtcid) where price < 0.50: 加 


显然 ， 在 这 些 特性 中 存在 着 元 余 现 象 。 比 如 ， 假 如 我 们 已 经 有 了 ON 子 句 ， 那 USING 子 句 
显然 是 多 余 的 一 一 它 只 能 处 理 对 名 字 相 间 的 列 进行 连接 操作 这 类 特殊 情况 .， 当然， 你 可 能 会 
问 本 节 所 介绍 的 任何 特性 是 否 真 的 为 SQL 增加 了 新 能 力 。 我 们 不 是 说 过 3.5 节 所 列举 的 SQL 荔 
能 已 提供 了 我 们 所 需 的 一 切 关 系 运 算 能 力 吗 ?显然 ，ANSI SQL-92 委 员 会 增加 新 的 语法 是 为 
了 使 查询 变 得 “更 简单 "”。 扫 而， 对 于 那些 必须 学 着 记 住所 有 这 些 语法 形式 的 初学 者 来 说 ， 事 
情 并 太史 得 就 变 简单 了 。ANSI SQL 标准 委员 会 正 朝 着 这 个 目标 继续 奴 力 ， 现在， 除 关键 词 
FULL 以 外 的 所 有 JOIN 形式 都 已 成 为 Core SQL-99 的 一 部 分 。 

3. OUTER JOIN 

下 面 讨论 图 3-11 中 确实 为 SQL 增 加 了 新 能 力 的 一 些 语 法 ， 困 为 它们 提供 了 经 典 关 系 代数 所 
不 具备 的 运算 ， 即 各 种 CUTER JOIN 形式 。 

[YLEFT 上 RIGHT | FULLI [OUTER] JOIN 

我 们 对 OUTER JOIN ( 我 们 这 里 称 之 为 FULL OUTER JOIN ) 的 最 时 介绍 出 现在 2.10 算 ， 
即 关 系 代 数 的 结尾 部 分 。 同 INNER JOIN 一 样 ， 在 任何 类 型 的 OUTER JOIN 中 都 必须 出 现 关键 
词 ON 或 USING 中 的 一 个 以 诀 定 哪儿 列 将 参加 有 连接。 

作为 第 一 个 例子 ,假定 有 两 个 表 : 3 和 T， 表 的 内 容 如 下 : 





S$ 和 T 的 FULL OUTER JOIN 将 产生 下 面 的 结果 : 


select * from 
$ Fu] outer join t using (AY: 





和 
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配 的 和 7r， 而 且 在 不 匹配 的 列 上 将 出 现 空 值 。 即 使 你 所 使 用 的 系统 不 支持 关键 词 FULL ( Core 
SQL-99 对 它 不 做 要 求 )， 你 仿 然 可 以 通过 如 下 形式 的 Core SQL-99 子 查询 来 实现 FULL 
OUTER JOIN 运算 ， 


select * from 5 1eft join T using AY union select * from S$ right join T Using (pa): 


注意 JOIN 运 算 符 作 用 在 tableref 的 内 部 ( 见 图 3-11 )、 而 UNION 则 作用 在 子 查询 上 ( 见 
岗 3-10) 所 以 ， 在 用 UNION 将 行 集 台 并 起 来 以 前 ， 需 要 建立 一 个 子 查询 以 选 出 连接 和 娠 果 表 中 
的 所 有 行 。 

作为 力 - -个 例子 ,假定 上 像 我 们 在 2.10 玉 里 所 做 的 那样 ) 有 一 个 名 为 sales 的 表 ， 该 表 
包含 两 列 ; 在 orders 表 中 出 现 的 代理 商 的 ai gd 以 及 表示 每 个 代理 商 订 货 总 金额 的 total 列 。 
注意 ， 如 果 一 个 aid 值 没 出 现在 orders 表 中 ， 那 我 们 就 认为 它 也 不 会 出 现在 sales 表 中 。 现 
在 要 和 慷 的 就 是 列 出 所 有 的 代理 商 以 及 他 们 相应 的 销售 业绩 ， 这 基本 上 就 是 sales 表 中 的 aig 
列 和 total 列 ,人 为 了 便于 理解 ， 我 们 需要 加 人 与 每 个 aiq 值 相对 应 的 代理 商 名 字 。 这 似乎 
意味 着 再 要 进行 如 下 形式 的 连接 运算 : 

select aname, aid, total from sales join agents using (aid)}; 

这 种 自然 连接 在 下 列 两 种 情况 下 会 产生 问题 ， 当 agents 表 中 有 一 个 代理 商 在 orders 表 
或 sales 表 中 没有 相应 行 的 时 候 〈 因 为 该 代理 商 没 有 订 尾 何 货 )， 以 及 当 有 一 个 代理 商 已 有 了 
-- 征 的 销售 业绩 但 在 agents 表 中 却 没 有 相应 的 aidq 值 的 时 候 ( 这 可 能 是 由 数据 项 中 的 错误 或 
延迟 造成 的 )。 为 了 解决 这 一 问题 ， 我 们 应 使 用 FULL OUTER JOIN 运算 符 ， 因 为 该 运算 即使 
当 一 个 表 在 及 一 个 表 中 没有 匹配 行 时 也 会 在 结果 中 保留 参加 连接 的 两 表 所 包含 的 所 有 行 ， 而 
昌 在 所 有 的 不 匹配 列 上 都 会 最 孙 空 值 : 


select aname, aid, total from sales fu11 outer jofn agents using aid); 


注意 ，FULL OUTER JOIN 这 三 个 词 没 必要 全 部 出 现 ; 根据 $8QL-99 标 准 ( 图 3-11 )， 写 成 
FULL JOIN 就 可 以 了 ， 但 要 注意 不 要 写成 DUTER JOIN。 同样 。 可 以 将 LEFT OUTER JOIN 写 
成 LEFT JOIN. 将 RIGHT OUTER JOIN 写成 RIGHT JOIN。 该 查询 的 结果 可 能 如 下 表 。 


Smth, | $30.00 
了 rown 3900,00 
Qiray 49 
ET 
在 该 表 中 ， 人 代理 商 a04 ( Gray ) 没有 任何 销售 业绩 ， 而 代理 商 a07 有 销售 业绩 ， 但 在 
agents 袁 和牛 却 没 有 aname 值 (在 agents 表 中 可 能 出 没有 aid 值 一 一 这 种 情况 必须 得 到 控制 ). 
LEFT QUTER JOIN 只 会 在 结果 中 保留 运算 符 左 边 表 中 的 行 ， 即 使 尖 该 行 不 能 与 右边 去 中 
的 任何 一 行 相 匹配 时 也 是 如 此 。 但 右边 表 中 的 不 匹配 行 就 不 能 被 保留 下 来 。 


select aname, aid, total from sales left outer join agents using taid): 
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在 这 种 情况 下 ， 行 (nul, a07, 650.00) 将 出 现在 结果 中 ,而 (Gray, a04, null ) 则 不 会 。 

当 运 算 符 右 馆 表 中 的 行 没 能 和 左边 表 中 的 任何 一 行 司 成 连接 时 ，RIGHT QUTER JOIN 只 
会 在 结果 中 保留 右边 表 中 的 行 。 

select aname, aid, total from sales right outker join agents Using (a1d):; 

这 里 ， 行 (Gray, a04, null ) 会 出 现在 结果 中 ， 而 《nulla07.650.00 ) 则 不 会 出 现 。 

4, 数据 库 系 统 所 实现 的 连接 形式 

大 多 数 数据 库 生 产 厂 商 还 没有 全 部 实现 这 些 连 接 运 算 ，DB2 UDB 实 现 了 我 们 已 讲述 的 除 
( 元 余 的 ) USING 子 名 以 外 的 所 有 形式 。ORACLE 仅 提供 了 左 外 连接 和 右 镍 连接， 并 采用 了 与 
ANSI SQL 标准 不 同 的 语法 。 在 ORACLE 中 ， 一 个 外 连接 要 用 WHERE 子 匀 中 的 特殊 条 件 来 表 
了 未 ， 例 如 : 


SELECT . . . FROM 7 了 1，TZ 人 WHERE {Ticl [ff)J = Te.c2 | Tiliei 一 T2c2 [LI+ 
AND search cond: 


T1 和 T2 两 表 中 忆 有 一 表 能 在 后 面 跟 上 带 括号 的 加 号 ， 而 这 意味 着 参加 连接 的 另 一 表 将 保留 所 
有 的 行 ， 共 至 包括 那些 不 满足 连接 条 件 的 行 。 注 意 ， 如 果 两 表 之 间 有 两 个 或 更 多 的 连接 条 件 ， 
那么 无 论 在 哪 种 情况 下 符号 【+ ) 都 必须 统一 地 作用 在 同 -- 个 表 上 ， 比 如 , T1l.cl = T2.e2 
(+) 和 Tt,c3 = T2.c4 (+)。 还 应 注意 的 是 ， 在 N 个 表 的 连接 中 ， 可 能 会 有 N - 1 个 表 带 有 
{+ )。 有 意思 的 是 我 们 能 将 表 中 的 一 列 和 一 个 后 面 紧 跟 符号 (+ ) 的 常数 作 比 较 ( select 
Tl1 .cl where Tl1.c2 = const1i{+) })， 这 会 促使 ORACLE 系 统 返回 在 被 比较 的 列 上 具有 
特定 常数 值 或 空 值 的 所 有 行 。 

INFORMIX 版 本 9.2 癌 ORACLE 一 样 ， 也 只 提供 了 左 外 连接 和 石 外 连接 ， 但 符号 表示 孝 略 
有 不 同 。 它 没有 往 和 WHERE 子 句 中 的 表 名 后 面 放 置 (+ )， 面 是 在 FROM 子 句 中 将 关键 词 
OUTER 置 于 第 二 个 表 名 之 前 。 用 INFORMIX 的 术语 来 说 ， 这 就 使 得 该 表 成 为 从 表 (subservient 
table)， 并 且 在 进行 连接 的 时 候 使 男 一 个 表 即 主 表 (dominant table) 中 的 全 部 行 得 以 保留 下 来 。 
在 FROM 子 名 中， 关键 词 QUTER 被 放置 在 右边 那个 表 的 前 面 ， 通 过 交换 左右 两 边 的 表 我 们 可 
以 实现 分 别 等 价 于 LEFT OUTER JOIN 和 RIGHT OUTER JOIN 的 运算 。 同 DRACLE 一 样 ， 在 
INPORMIX 中 人 参与 连接 操作 的 两 表 中 只 有 一 个 表 能 具有 这 样 的 性 质 。 


3.7 SQL 中 的 集合 函数 


下 面 介绍 已 得 所 有 的 主要 数据 库 产品 中 得 到 了 全 面 实现 的 功能 ，SQL 提 供 了 五 个 作用 在 
列 值 集合 上 的 内 置 函数 ， COUNT、MAX、MIN、SUM 和 AVG。 除 COUNT 外 ， 这 些 集合 函数 
都 必须 作用 在 由 简单 值 组 成 的 集合 上 ， 也 就 是 ， 数 字 集 合 或 字符 串 集合 ， 而 不 是 拥有 多 个 列 

例 3.7.1 求 出 所 有 订货 变易 的 总 金额 。 此 查询 可 以 写成 


select sumtdollarsy as totaldollars from orders;: 
把 该 查询 几 在 实例 数据 库 上 将 得 到 一 个 只 人 富 一 行 的 点 
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同 数据 库 领 域 里 的 其 他 术语 一 样 ， 集合 孙 数 的 术语 也 有 一 些 变 体 。X/Open 标 准 和 ANSI 
SQL 标 准 称 它们 为 二 个 集合 西数 (set function); C.JDate 的 文章 以 及 INFORMIX 文 档 都 称 之 为 
聚集 函数 ( aggregate tunction ) ( 聚集 的 意思 是 “将 许多 不 同 的 元 素 一 起 放 人 单个 容器 中 , 或 
合计 ”) ; ORACLE 称 之 为 组 阵 数 (group function ) ; 而 IBM 的 产品 ，DB2 Universal 
Datahase， 则 使 用 术语 列 函 数 ecolumn function}。 如 果 你 在 同 熟 悉 其 他 产品 的 人 交谈 时 使 用 了 
集合 汕 数 这 一 术语 ， 他 们 应 该 在 理解 上 不 存在 什么 困 准 。 图 3-12 描 述 了 基本 SQL 和 Core SQL- 
99 所 规定 的 集合 阴 数 语法 。 


CE 
任意 (可 以 是 数值 型 
数值 型 数值 型 
数值 型 数值 型 
字符 型 或 数值 型 | 同 参 数 内 容 一 样 
学 符 型 或 数值 型 | 疗 参 数 内 容 一 样 








图 3-12 SQL 的 集合 函数 


要 特别 注意 的 是 ， 当 我 们 把 MAX 和 MIN 这 两 个 图 数 应 用 在 字符 型 的 参数 集合 上 上 时， 它们 
分 别 返 回 所 有 参数 中 按 字母 顺序 排列 的 最 大 值 和 最 小 值 。 此 外 ， 呈 个 数值 集合 的 AVG- 与 用 
COUNT 除 SUM 所 得 的 结果 是 -- 样 的 (只 要 这 两 种 方法 所 处 理 的 都 是 经 过 正确 定义 的 数值 并 
且 不 存在 浮 点 溢出 问题 )。 

例 3.7.2 ”为 了 炒 出 产品 p03 的 订购 总 量 ， 我 们 可 以 使 用 函数 SUM 并 把 它 作 用 在 满足 由 应 
条 件 的 行 集 上 : 

select sum(qty) as TOTAL 

from orders Where pid -= 'p0O3": 





600，1000 和 800 的 利 。 国 
不 要 把 集合 函数 与 诸如 upper 和 subst 之 类 的 标量 鹃 数 混淆 起 来 ， 尽 管 标量 明 数 也 能 出 现在 Select 

语句 选择 序列 的 表达 式 中 。 这 些 内 置 标量 函数 以 单个 行 值 为 参数 并 为 每 一 行 返 回 一 个 与 之 对 应 的 单 

值 ， 而 集合 函数 则 把 一 个 表 中 所 有 符合 特定 条 件 的 值 组 全 起 来 并 返回 一 个 单 值 。 这 样 ，Select 请 何 


select Sunmfdol1arsl as TOTAL 
from orders where pid = ‘pO3"; 


将 返回 一 个 单 值 ， 而 语句 


select uppericname} as UPCHAME from customers 
where discnt >= 10: 


将 返 同 一 列 值 ， 这 些 值 与 customers 表 中 满足 discnt>=10 的 所 有 行 -- 一 对 应 。 我 们 将 在 
39 节 中 给 出 内 兽 消 数列 表 。 
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例 3.7.3 求 出 顾客 总 数 的 查询 应 使 用 COUNT 范 数 而 且 不 应 局 恨 于 对 简单 值 集合 应 用 
COUNT。 下 列 两 种 形式 光正 确 : 


select counticid} 


from customers: 


或 者 
seElect Counti*) 
from tustomers,; 


第 …- .个 Select 语 名 计算 在 cid 列 下 出 现 的 值 的 数量。 要 特别 注意 的 是 ， 它 对 列 中 的 空 值 是 忽略 
不 计 的 。 此 例 中 的 两 个 语句 会 给 出 相同 的 答案 ， 困 为 Create Table 语 句 不 允许 在 customers 
表 的 cid 列 上 出 现 空 值 。 国 
我 们 可 以 要 求 集合 函数 仅 对 满足 特定 条 性 的 不 同 (distinct ) 值 起 作用 。 
例 3.7.4 求 出 有 顾客 居住 的 城市 的 数 上 月。Select 语 句 


select countidistincet city) 
from tustomers: 


将 产生 有 顾客 居住 的 不 同城 市 的 数目 ; 同样 ， 这 里 没 把 空 值 计算 在 内 。 由 于 在 图 2-2 的 
CAP 数 据 库 中 有 两 个 顾客 住 在 Dallas 以 及 两 个 住 在 Duluth ， 上 述 语句 的 查询 结果 是 3， 这 与 设 
加 关键 词 DISTINCT 的 同一 查询 的 结果 相差 其 远 ， 


select count{city; 


from customers: 


该 查 高 的 结果 是 5。 注 意 ， 求 出 有 显 客 居住 的 城市 的 数 日 这 -- 请 求 一 般 者 会 被 解释 成 不 同 
城市 的 数量 ， 所 以 第 二 种 形式 从 蘑 种 意义 上 来 说 是 不 对 的 。 国 

查询 的 选择 列表 引用 集合 函数 的 基本 SQL 通用 形式 为 : 

SET_FUNCTION NAMECTALL ] DISTINCT] Colname) | COUNTt*) 

ALL 或 DISTINCT 都 可 以 出 现在 colname 的 前 面 ， 但 缺 省 俩 为 ALL。 

将 美 键 词 DISTINCT 和 果 数 MAX 或 MIN 放 在 一 起 使 用 是 没有 价值 的 ， 因 为 这 两 个 函数 都 
只 从 集合 中 选 出 一 个 值 而 且 在 任何 情况 下 都 不 考虑 重复 行 。 此 外 ， 如 下 格式 的 查询 : 

setect sumidistinct doltars)y from orders Where ， 
所 针对 的 请 求 比较 特殊 ， 它 强调 相 如 的 金额 必须 互 不 相同 。 在 通常 情况 下 使 用 隔 数 SUM 和 
AVG 都 不 需要 这 样 考 虚 。 

这 里 有 一 个 重要 的 约束 ， 即 在 WHERE 子 名 的 比较 操作 中 不 允许 出 现 集合 函数 ， 穆 非 它们 
是 出 现在 于 查询 的 选择 列表 中 ， 


例 3.7.5 列 出 折扣 值 小 于 最 大 折扣 值 的 所 有 顾客 的 cia 值 。 王 曾 的 方法 是 不 正确 的 ; 


select cid from customers 
where discnt < maxtdiscnt}; 一- ** TINYALID SOL SYNTAX 
上述 判断 的 基本 依据 是 : 该 Select 语 名 只 会 有 一 个 范围 变量 【变量 和 为 customers )， 巧 
依次 指向 customers 表 中 的 每 一 行 ; 但 要 使 max (discnt) 的 值 有 意 头 ， 必 须 预 先生 成 一 个 
遍历 customers 表 中 所 有 discnt 慎 的 循环 。 然而 ， 基本 的 Seleet 思 想 却 无 法 实现 这 样 一 个 独 
立 的 循环 。 用 户 可 以 用 一 种 不 同 的 方法 来 检索 所 需 的 信息 : 


select cid From customers 
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where discnt < (setect mx{discnt) From customers): 
注意 ， 这 里 有 了 两 个 名 为 customers 但 完全 不 同 的 范围 变量 ， 首 先 计算 于 查询 以 提供 外 屋 
Select 所 需 的 值 。 由 于 子 查 询 返 回 了 一 个 单 儿 素 集 合 ， 所 以 这 里 能 使 用 包含 单个 小 于 号 (<) 的 
比较 运算 。 我 们 也 可 以 使 用 比较 运算 符 <ANY 或 <ALL， 因 为 对 返回 值 为 单元 素 集 合 的 于 查询 
来 说 ， 这 类 比较 运算 与 一 般 的 小 于 运算 是 等 价 的 。 时 
例 3.7.6 ”回顾 俩 3.3.7 查 询 ， 找 出 被 至 少 两 个 顾客 订购 的 所 有 产品 。 我 们 现在 能 用 为 一 种 
方法 来 解决 该 问题 ， 把 这 种 方法 推广 到 多 于 里 个 顾客 的 情况 上 应 该 是 易 如 民 车 。 


select pP-pid from products p 
Where 2 <= select countidistinct cid}y From orders 
where pid 一 p.pid}: 


此 查询 返回 表 : 





空 值 的 处 理 

空 值 的 概念 最 早出 现在 2.4 节 ， 但 在 介绍 集合 函数 的 定义 以 前 ， 我 们 还 无 法 讲述 此 概念 押 
涉及 的 一 些 思想 细节 。 空 值 是 特殊 的 标量 常数 《 在 数值 型 或 字符 串 型 的 列 上 有 意义 )， 它 代表 
了 未 定义 的 (不 适用 的 ) 或 者 有 意义 但 在 月 前 还 处 于 未 知 状态 的 值 。 比 如 ， 当 我 们 往 
emobloyees 表 中 搬 人 新 的 一 行 时 ， 由 于 薪水 还 林 确 定 ， 我 们 可 能 希望 该 行 在 salary 列 上 的 值 
为 空 ; 另 一 方面 ， 如 果 一 个 员工 的 工作 类 别 是 “图 书 管理 员 ”， 那 他 的 Percent( 佣金 百分率 ; 
可 能 为 空 值 ， 因 为 从 事 这 类 工作 的 员工 都 是 没有 销售 佣金 的 《这 样 的 列 值 就 是 未 定义 的 , 或 
者 说 不 适用 的 )。 当 前 的 大 多 数 商 用 系统 所 实现 的 空 值 概念 部 还 不 区 分 这 丙种 情况 ( 尽管 已 经 
有 人 建议 这 么 做 了 ) 

注意 一 些 老 的 数据 库 系 统 没 能 很 好 地 实现 空 值 。 在 这 些 系统 里 ， 字 符 型 的 列 用 空 自 笠 

来 代 茜 空 值 ， 而 数值 型 的 列 则 用 零 来 代替 空 值 ; 我 们 特 看 到 这 在 某 些 情况 下 会 产生 严 

重 的 后 时 。 

尽管 我 们 暂时 还 不 研究 SQL Insert 语 句 的 完整 语法 ， 但 为 了 说 明 -- :个 表 中 怎样 才 会 出 现 空 
值 ， 下 面 的 例子 将 涉及 Insert 语 句 的 -- 些 简单 用 法 。 

例 3.7.7” 往 customers 表 中 加 入 在 cid，cname 和 city 列 上 分 别 等 于 某 些 特定 值 的 一 
行 。 我 们 从 图 2-2 中 看 到 : 在 customers 表 中 还 有 一 列 : discnt， 但 这 里 假定 在 插入 新 行 时 
该 值 还 处 于 未 知 状态 一 一 也 就 是 说 ， 顾 客 的 折扣 值 还 设 定 。 


insert into customers tcid, cname, city) 
values [co , "Winbix",. "Dallas"}: 


由 于 此 Insert 诸 名 的 麟 名 序 麟 或 值 序列 部 没有 提 到 discnt 列 ， 新 搬入 行 的 4aiscnt 值 就 缺 省 为 
空 值 。 大 多数 数据 库 产品 都 允许 在 Insert 的 Values 子 句 中 用 NULL 来 明确 地 指定 一 个 空 值 ; 此 
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特性 已 成 为 SQL-92 标 准 的 一 部 分 。 图 
出 现在 一 个 表 中 的 空 值 具 有 许 包 重要 的 性 质 。 首 先 ， 在 搜索 条 件 的 任何 一 个 一 般 比 较 请 
间 中 出 现 的 空 值 都 会 使 乏 个 谓 间 等 于 一 个 既 不 是 TRUE 也 不 是 FALSE 的 特殊 布尔 值 : 
UNKNOWN 。 对 一 个 要 被 Select 语 癸 选 取 的 行 来 说 ， 它 必须 使 WHERE 子 名 中 的 复合 谓词 等 于 
TRUE， 所 以 UNKNOWN 值 在 大 多 数 情 况 下 实际 上 与 FALSE 失 有 相同 的 效果 。 
例 3.7.8 在 例 3.7.7 往 customers 表 中 加 入 行 (c007, Windix,，Dallas, null) 之 后 ， 下 面 的 
Select 语 名 仍然 检索 不 到 这 一 行 。 


select * from customars Where discnt <= 10 or discnt > 10: 


这 真 令 人 惊 计 ! 尽管 此 处 的 WHERE 子 句 看 上 去 覆盖 了 所 有 的 倩 况 ， 但 如 果 在 小 于 10、 等 于 10 
或 大 于 10 的 比较 中 出 现 了 空 值 ， 邦 整个 WHERE 子 句 将 等 于 UNKNOWN 。 如 果 要 用 包含 
discnt 的 俏 词 来 检索 Giscnt 值 为 空 的 行 ， 那 唯一 办 法 就 是 使 用 特殊 谓词 IS NULL.: 

select * from customers where discnt is null. 
此 外 ，SQL 还 特别 提供 了 测试 ai scnt 值 非 空 的 谓 间 : djscnt is not nu]1, 但 是 谓词 
discnt is null 的 一 些 变 体 形式 ， 比 如 aiscnt = nul11， 昌 然 也 符合 基本 SQL 语法 ， 
其 效果 却 是 错误 的 。 如 果 SQL 在 检查 语法 错误 的 时 候 就 能 否决 这 样 的 语句 ， 那 我 们 就 更 容易 
信人 免 这 类 错误 ,但 与 任何 其 他 编程 环境 一 样 ，SQL 系 统 有 时 也 会 给 出 违背 你 意愿 的 结果 。 图 

在 这 里 ， 我们 要 重申 上 向 提 到 的 一 个 重 虚 观 点 如 虹 :个 空 值 出 现在 任何 一 个 一般 比较 
谓 阅 中 ， 那 么 该 谓 间 等 于 UNKNOWN 【我们 将 在 3.9 节 中 详细 讨论 这 个 特殊 布尔 值 )。 此 规则 
其 至 对 形 如 coll = co12 且 同一 行 上 的 co11 列 和 co12 列 均 为 空 值 的 相等 谓词 也 成 立 ; 也 就 
是 说 ， 在 这 种 情况 下 ,该 谓词 仍然 等 于 UNKNOWN。 此 规则 仅 对 特殊 谓词 IS NULL 不 适用 。 

值得 注意 的 是 ， 诸 如 0 之 类 的 常规 值 或 者 由 两 个 连续 单 引 导 {" } 表示 的 空 申 都 不 其 备 例 
3.7.8 所 显示 的 特性 。 空 串 小 于 'a'( 按 学 苹 硕 序 }， 零 小 于 10， 迪 被 赋予 了 真实 值 ( 非 空 值 ) 的 
行 总 能 被 某 个 谓词 检索 到 。 但 用 常规 值 或 空 串 来 表示 空 值 有 时 会 产生 问题 : 一 个 奈 水 为 空 的 
新 员工 并 不 一 乍 会 成 为 扶贫 计划 的 候选 人 ， 但 如 果 他 的 薪水 为 零 的 话 ， 显 然 他 就 会 成 为 候选 
人 。 这 里 还 产生 了 天 一 个 问题 : 如 果 我 们 正 试 着 计算 一 个 部 门 的 平均 匣 水 ， 将 新 员工 的 薪水 
计 为 雯 来 求 平均 是 相合 适 的 。 一 种 更 好 的 方法 是 把 新 员 . 工 完全 排除 在 考虑 范围 之 外 ， 而 这 正 
是 集合 郴 数 处 理 空 值 的 方法 。 

例 3.7.9 ”在 例 3.7.7 把 行 (c007, Windix, Dallas, nulD 搬 和 人 customers 表 之 后 ， 求 出 所 有 顾 


客 的 折扣 平均 值 。 
select avgtdiscnt) from customers: 
在 该 SQL 语句 中 ， 空 值 在 计算 平均 值 以 前 就 已 被 竺 弃 。 图 


有 关 空 值 处 理 的 类 似 粮 法 同样 也 适用 于 其 他 一 些 集 合 函 数 。 正 如 我 们 在 紧 接着 图 3-12 的 讨 
沦 中 提 到 的 那样 ，ayg( ) = sum Ycount( )， 所 以 很 显然 sum( ) 和 coeunt( ) 盟 数 也 必定 不 者 虚空 值 。 
这 里 还 有 :个 有 趣 的 问题 : 作用 在 空 集 (没有 相关 的 行 存在 ) 上 的 集合 区 数 将 返回 全 和 公 值 ? 
管 案 视 负数 而 定 : count( ) 对 空 集 返 回 骞 ， 而 sum( )、avgf )、maxf ) 和 mint ) 都 返回 一 个 空 值 . 
3.8 ”SQL 中行 的 分 组 


SQL 允 许 Select 语 名 提供 一 种 自然 的 “报表 ”功能 : 根据 某 些 列 值 的 共性 把 一 个 表 所 包含 
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的 全 部 行 分 成 者 干 个 子 集 ， 然 后 对 每 个 子 集 执 行 集合 函数 。 比 如 ， 考 虑 查询 


[3.8.1]) seleet pid, sum(tqty) as total from orders 
group by pid; 


Select 语 名 的 GROUP BY 子 可 将 产生 一 个 行 集 ， 其 效果 好 比 是 执行 了 下 面 由 循环 控制 的 查询 ; 


FOR EACH DISTENCT VALUE ¥ OF pid IN orders; 
select pid, sumtqty) as total from orders where pild = Y: 


END FOR: 


Select 语 句 [3.8.1] 中 的 GROUP BY 子 句 的 结 昌 为 表 ， 
a | orn | 
| pot | ss00 | 
p04 | 600 | 


400 


出 现在 选择 列表 里 的 集合 函数 分 别 将 每 一 组 里 的 行 聚集 起 来 并 为 每 个 组 创建 一 个 值 、 这 
里 很 重要 的 一 点 是 : 选择 列表 中 的 所 有 属性 都 必须 以 单个 原子 值 来 对 应 由 GROUP BY 分 得 的 
每 一 组 。 比 如 ,下面 的 Select 语 句 是 无 效 的 ; 


select pid, cid, sumeqty) from Orders 
group by Pid; -~-- ** TINYALID SOL SYNTAX 


我 们 无 法 在 与 每 个 bid 值 相对 应 的 单独 一 行 上 打印 出 多 个 不 间 的 cid 值 ; 比如 ， 由 产品 
p01 标识 的 第 一 组 对 应 于 一 组 cid 值 {c001, c004, c006}。 但 是 ，Select 语 句 的 GROUP BY 子 句 
本 身 却 能 包含 多 个 列 名 。 比 如 ， 我 们 可 以 对 oraders 表 中 的 两 个 ID 属性 进行 GROUP BY 操作 
并 且 在 选择 列表 中 检索 它们 。 


例 3.8.1 创建 -- 个 计算 每 样 产 品 被 每 个 代理 商 订购 的 总 量 的 查询 。 在 下 面 的 Seleet 语 句 中 ， 
我 们 按 orders 表 中 的 pid 和 aigd 来 分 组 ; 


seleet Pid, aid, sumtqty, 3&5 TOTAL Trom arders 













group by pi1d, aid.: 


作为 该 查询 的 结 宁 ， 我 们 得 到 下 面 的 表 : 


pl | 201 
pt2 400 


Fadl | a03 1D4 | 


下 到 aa Wr, 
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如 果 同 时 使 用 WHERE 子 馈 和 GROUP BY 子 句 ， 我 们 可 以 对 表 的 笛 卡 儿 积 进行 分 组 ， 
例 3.8.2 打印 出 代理 隘 的 名 字 和 标识 号 、 产 章 的 和 名字 和 标识 号 以 及 每 个 代理 商 为 顾客 
c002 和 c003 订 购 该 产品 的 总 量 。 


select aname, a.aid, phame, Pp.pld. sumtqty?} 
from Srders 其 。 products pp, agents a 
where x.pid = p.pid and x.aid = a.aid and x.cid in Te coOD3') 
greoup by a.aid, a,.aname, p.Pid, Pp.pname: 


对 十 该 查 谢 ，OQRACLE 返 吉 下 表 : 


own | a0 | pe | p05 | 2400 | 





由 于 a .aname 和 p .pname 在 选择 列表 中 ， 所 以 GROUP BY 于 和 句 就 有 必要 同时 包含 
a.aname 和 a.aid、p.pname 利 p .pid 以 向 系统 保证 选择 列表 中 的 每 一 列 都 以 单 秆 来 对 应 每 
一 组 。 事 实 上 ，a .aid 是 agents 表 中 行 的 唯一 标识 ， 而 pb . pid 是 progucts 表 中 行 的 唯一 标 
识 ， 所 以 在 GROUP BY 列表 中 包含 a .aname 和 Pp.pname 不 会 引起 组 的 进一步 细 分 。 然 布 ， 大 
多 数 数 据 库 系 统 都 还 没有 注意 到 这 … 事 实 ， 并 有 日 如 果 GROUP BYTY 子 句 没 有 包含 a .aname 和 
Pp.Pname 询 ， 他 们 就 会 发 出 抱 急 。 | 


注意 GROUP BY 子 句 要 紧 跟 在 WIIERE 子 名 的 后 面 。 求 解 了 查询 (没有 UNION 、 
INTERSECT 或 EXCEPT 操 作 ) 的 概念 性 步 又 如 下 . 

* 首先 ， 对 FROM 子 句 中 的 所 有 表 和 做 笛 卡 刀 积 。 

。 接 着， 删除 不 满足 WHERE 子 和 名 的 行 。 

*“ 然后， 根据 GROUP BY 了 字句 对 剩余 的 行进 行 分 组 。 

* 最 后 ， 求 出 选择 列表 中 的 表达 式 的 值 。 

正如 我 们 在 例 3.3.6 和 例 3.4.6 后 面 的 讨论 中 提 到 的 那样 ， 上 述 求 解 子 查 谢 的 概念 性 步 苦 可 
能 与 一 个 数据 库 产品 执行 Select 语 句 的 实际 步骤 大 相 径 庭 。 回 顾 前 而 对 空 值 的 讨论 ; 集合 函数 
忽略 了 所 有 的 空 值 ; 空 值 不 能 通过 搜索 条 件 中 的 所 有 相等 或 不 等 测试 一 甚至 对 -个 空 值 等 
于 男 … 个 空 值 这 样 的 测试 ， 也 是 如 此 。 但 是 ， 出 现在 作为 GROUP BY 对 象 的 列 土 的 空 值 确实 
会 寻 致 相应 的 行 被 分 在 同一 组 里 。 我 们 将 在 本 章 结 尾部 分 的 习题 中 进 -和 步 探讨 这 一 问题 。 

如 果 要 从 包含 GROUP BY 子 铝 的 Select 语 何 的 结果 中 去 掉 某 些 行 ， 比 如 ， 当 选择 列表 中 诸 
如 sumtgqty) 之 类 的 合计 值 太 小 时 就 去 除 相 应 的 结果 行 ， 我 们 不 可 能 通过 在 WHERE 子 铝 度 置 
约束 条 件 来 实现 这 一 目标 。 

select pid. sumtqty) from orders  -- ** INYALID SQL SYNTAX 

where sumtdqtyy > 1000 
group by pid: 

首先 ,一 个 集合 阴 数 不 能 出 现在 WHERE 子 名 中， 除非 它 是 在 子 查 淘 的 选择 列表 中 (参见 
例 3.7.5 )。 更 重要 的 是 ， 我 们 刚 说 过 在 GROUP BY 子 句 执行 分 组 操作 以 前 WHERE 子 各 在 理论 
上 已 删除 了 所 有 不 满足 搜索 条 件 的 行 ， 这 意味 着 WHERE 子 句 中 的 条 件 不 可 能 顾及 在 选择 列表 
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中 的 合计 值 ， 内 为 这 些 合 计 值 取决 于 实际 的 分 组 情况 。 为 了 能 创建 基于 分 组 情况 的 条 件 ， 大 
多 数 标准 都 为 SQL Select 语 句 提 供 了 一 种 新 的 约 上 子 匀 一 一 HAYING 子 句 ， 它 的 求解 过 程 发 生 
在 GROUP BY 操作 之 后 。 


例 3.8.3 ” 当 某 个 代理 商 所 订购 的 某 样 产 上 电 的 总 量 超过 了 1000 时 ， 打 印 出 所 有 满足 条 件 的 
产品 和 代理 商 的 ID 以 及 这 个 总 量 。 


select pid, aid, sumtqty) as TOTAL from orders 
droup by pid, aid 
having sum(iqty) > 1000: 
注意 ，HAVING 子 侣 的 操作 其 跟 在 GROUP BY 于 名 的 操作 之 后 但 先 于 对 选择 列表 中 的 表 
达 式 的 计算 。 该 查询 打印 出 查询 [3.8.1] 的 结果 表 中 旺 右 边 那 一 列 超过 1000 的 所 有 行 : 


re ve rn 
mr ro 
Hiear. 


在 Select 语 句 中 ，HAYING 子 名 只 能 对 与 各 个 分 组 相对 应 的 单 值 (也 就 是 能 合法 地 出 现在 
选择 序列 中 的 值 ) 进行 测试 。 峡 3-13 所 列 的 子 查询 通用 形式 是 子 但 询 的 最 终 形 式 ; 也 就 是 说 ， 
在 子 查询 中 不 再 会 出 现 新 定义 的 子 句 。 然 而 ， 要 实现 完整 的 Select 语 句 ， 我 们 还 需要 定义 一 个 
新 的 子 句 。 












subquery : :一 
SELECT [ALL | DISTINCT] { * | expr [AS] c_alias] {. expr [[AS] c_alias]...!) 
FROM tableref {, tableref...] 
[HHERE search_ condition] 


[GROUP BY eolname {, colname,...}] 
[HAYING search condition]:; 
subquery UNION [LAEL] subdguery 





图 3-13 基本 SQL 了 于 查询 的 通用 形式 (作为 Select 语 句 也 是 可 以 的 ) 


在 上 面 的 基本 SQL 地 查询 形式 中 ，FROM 子 句 中 的 tabLeret 专 指 3.6 和 中 国 3-11 第 一 行 
的 简单 形式 : 

tabhleref: := tablename [[AS$] corr_name] 

我 们 的 基本 SOL 通 用 形式 设 有 引用 图 3-11 所 列 的 tabLeret 语 法 的 通用 形式 。 此 外 ， 还 要 
注意 基本 SOL 只 包含 了 UNION [ALE] 运 算 符 而 没有 包含 INTERSECT 和 EXCEPT。 尽 管 例 3.3.7 
和 3.7.6 已 经 用 荫 种 完全 不 同 的 Seleet 语 句 解 决 了 同一 问题 ， 这 里 的 HAVING 子 名 又 为 我 们 提供 
了 一 种 解决 该 问题 的 新 力 法 。 

例 3.8.4 求 出 被 至 少 两 个 顾客 订购 的 所 有 产品 的 Pida 值 。 

select pid from orders 


group by pid 
having counttdistinct cid} > 2; 
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在 上 面 的 Select 语 名 中 ， 引 用 ciqd 是 一 项 危险 的 操作 ， 因 为 与 根据 pid 值 分 得 的 每 个 组 相 
对 应 的 cid 值 不 是 单 值 。HAYING 子 句 必须 作用 在 能 出 现在 选择 列表 中 的 值 上 ， 因 为 这 些 值 必 
定 是 在 分 组 过 程 中 形成 的 单 值 。 然 而 ， 对 根据 bidG 值 分 得 的 每 个 组 来 说 ， 集 人 台 函 数值 
COUNT (cid) 是 单 值 的 ， 而 且 由 于 它 能 出 现在 选择 列表 中 ， 所 以 它 也 可 以 出 现在 HAVING 子 
名 中。 该 查询 的 结果 在 下 面 的 表 中 : 





注意 ， 在 一 般 情况 下 我 们 不 会 使 用 HAVING 子 句 ， 除 非 有 GROUP BY 子 铝 出现; 如 果 
GROUP BY 子 条 被 省 上 了 ， 和 那么 HAVING 子 句 将 把 整个 结果 当成 一 个 组 来 合用。 这样 ， 在 例 
3.4.8 中 ， 如 果 没 有 group by pid 语 句 但 HAYING 子 句 仍然 存在 ， 那么 打印 出 来 的 结果 将 是 
一 张 空 表 ， 除 非 在 orders 表 中 至 少 有 两 个 不 同 的 ciad 值 . 

我 们 所 介绍 的 基本 SQL Select 语 名 的 道 用 形式 不 允许 集合 函数 的 退 套 ， 比 如 ， 我 们 不 能 把 
AVG 画 数 应 用 在 由 MAX 元 素 组 成 的 集 台 上 。 尽 管 如 此 ，3.6 节 所 介绍 的 通用 语法 已 提供 了 一 种 
实现 髓 套 的 方法 。 

例 3.8.5 ”构造 一 个 查询 来 求 出 所 有 代理 商 的 最 大 销售 额 平 均值 。 在 基本 SQL 中 ， 把 一 个 
集合 函数 基 人 另 一 个 集合 函数 的 内 部 是 行 不 通 的 ， 如 下 所 未 : 

selerct avgtselect maxtdollars} from orders -~ ** [NYALID SOL SYNTAX 

group by aid): 

该 SQL 语 句 之 所 以 无 效 是 因为 基本 SQL 既 不 多 许 集合 函数 内 部 包含 子 伸 询 也 不 允许 FROM 
子 名 包含 子 间 询 。 但 如 果 使 用 了 图 3-11 的 扩展 语法 (参见 3.6 节 )， 我 们 就 能 将 子 查询 议 在 FROM 
子 句 中 (这 无 法 用 基本 SQL 来 实现 )。 通 过 对 表 重 新 命名 并 对 集合 函数 生成 的 列 命名 ， 我 们 能 
如 愿 以 偿 地 实现 上 述 坦 询 ， 如 下 所 示 : 


select avgtt,x} from (tselect aid, maxtdollars) as 其 
from orders group by aidy t: 


这 里 的 FROM 子 铝 将 子 查询 的 结果 表 重 命 刹 为 t+【 这 也 是 必要 的 )， 并 在 选择 列表 中 将 检 
索 到 的 肾 集 列 命名 为 x。 这 样 ， 外 层 的 Select 语 句 就 能 对 t . x 冰 平 均 。 该 查询 在 DRACLE 和 
DB2 UDB 中 是 可 行 的 。 上 述 子 查询 的 结果 是 下 面 的 表 : 


Ta 
500.00 


-- ** ACDVYANCED SAL 








30 
om 


和 






[= 






他 
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外 屋 的 Select 语 句 将 返回 这 些 值 的 平均 值 582.33。 加 
3.9 SQL Select 语 名 的 完整 描述 


图 3-14 列 出 了 基本 SQL Select 语 句 的 通用 撒 式 ， 其 中 的 新 语法 元 率 部 会 在 让 面 的 眉 浅 中 得 
到 定义 。 所 有 的 SQL 语 法 事 将 在 本 节 绪 以 前 介绍 完毕 。 


subquery : := 
SELECT [ALL | DISTINCT] [ * | expr [faAS] c_ alias] {, expr LLAS] ce_al*as]...+l 
FROM tableref {, tableref...!} 
[WHERE search condition] 
LGROUP BY colname [, colname...1] 


[HAYING search condlition] 
| SUubquery UNION CALE] subyuery 


Select statement ::= 
subguery [LORDFR BY result column [ASC | DESEY {, result column fase | DESC]...]] 





图 3-14 医 本 SQL 丁 查 调和 Select 语 名 的 通用 形式 


如 图 3-14 所 示 ，ORDER BY 子 句 不 能 出 现在 子 查询 形式 中 ， 而 只 能 出 现在 完整 的 Selectj 各 可 
中 。ORDER BY 是 新 加 入 的 子 句 ， 它 允许 我 们 将 最 后 的 结果 行 根据 出 现在 选择 列表 中 的 一 个 或 
多 个 铺 果 列 (result_columns ){ 列 名 或 列 别 和 名 ) 排序 。 当 选择 列表 所 指定 的 结果 列 多 于 一 个 
时 ， 早 果 行 首先 根据 排 在 最 前 面 的 结果 列 来 排序 ， 仅 当 根 据 最 先 的 /个 结果 列 排序 所 得 的 行 序 相 
同时 ， 我 们 才 需 上 改 考 虑 位 于 第 i + 1 个 位 置 上 的 结果 列 。 为 了 提供 更 大 的 灵活 性 ，SQL 人 多 许 在 
ORDER BY 子 句 中 用 列 号 1 到 n 来 指定 结果 列 ， 其 中 ,rn 是 出 现在 选择 列表 中 的 位 的 数 自 。 列 与 选 
项 是 针对 阁 果 列 没有 有 效 列 和 名 这 类 情况 而 设立 的 。 比 如 ， 计 算 一 个 表达 式 之 后 没有 为 其 创建 询 
别名 就 会 导致 这 种 情形 。 产 生 这 种 情 沈 的 另 一 种 可 能 性 是 Select 语 句 是 许多 不 同 子 查询 的 并 ， 因 
为 我 们 不 能 假定 在 不 辣子 查 淘 的 选择 列表 中 彼此 对 应 的 列 者 具有 相同 的 限定 人 名。 闻 [ASC | DESOC] 
选项 中 ( 升序 或 降序 )，ASC 是 缺 省 的 选择 ， 这 意味 着 值 越 小 的 行将 越 早 地 出 现在 结果 表 中 。 

注意 ， 如 果 出 现在 作为 DRDER BY 对 蒙 的 列 上 的 值 为 空 ， 邦 相应 的 结果 行将 被 放 到 相同 
的 排 闻 位置 上 ,或 太 ("高") 十 或 小 (“ 低 " ) 十 在 该 列 上 具有 非 空 值 的 所 有 行 。 空 值 的 确切 
排序 位 置 视 产 品 而 定 ， 因 为 各 种 标准 都 没有 对 此 作出 规定 ; 所 以 , 在 ORACLE 和 DB2 UDB 中 ， 
社 值 被 排 伍 “高 ”处 ， 但 包括 INFORMIX 人 在 内 的 其 他 一 些 产 品 都 把 空 值 排 在 “ 低 ” 处 。 当 然 ， 
在 WHERE-F 人 中 对 某 个 列 应 用 IS NOT NULL 谓 词 可 以 避免 对 该 列 值 为 空 的 行进 行 检索 。 
首先 ， 对 FROM 子 名 中 的 所 有 圾 做 关系 磁 积 。 

接 靖 ， 删 除 下 注 足 WHERE 子 铝 的 行 。 

根据 GROUP BY 子 包 对 剩余 的 行进 行 分 组 , 

然后 删除 不 满 臣 HAWINGO 子 旬 的 组 ， 

求 出 SELECT 地名 选择 列表 中 的 去 达 式 的 值 。 

若 有 关键 闻 DISTINCT 存 在 ， 则 删除 重复 的 行 ， 
求解 子 杏 询 的 UNION ，INTERSECT 和 EXCEPT。 

展 后 ， 芒 有 DRPER BY 子 句 存在 ， 则 对 所 有 选 出 来 的 行进 行 排序 。 





韦 
韦 
赴 
三 
虽 
时 
赴 
韦 


图 3-15 求解 Select 语 名 的 概念 性 步 又 
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在 图 3-14 所 列 的 通用 形式 中 ， 各 子 名 在 Select 语 句 中 的 排列 顺序 可 被 青 做 求解 过 程 的 购 念 
性 顺序 ， 我 们 可 以 从 图 3-15 中 看 出 这 一 点 。 新 加 和 的 步骤 以 这 种 顺序 出 现 是 非常 合理 的 ， 天 
为 ， 求解 ORDER BY 子 句 ， 即 根据 甘 些 列 值 将 结果 行 按照 一 定 的 顺序 排列 ， 显 然 是 显示 结果 
前 的 最 后 一 步 。 我 们 要 再 一 次 提醒 读者 ; 这 种 求解 过 程 的 概念 性 步骤 可 能 与 查询 优化 器 所 选 
拌 的 实际 步骤 有 相当 大 的 差别 。 

例 3.9.1 ” 列 出 所 有 的 顾客 、 代 理 商 以 及 与 每 个 顾客 -代理 商 对 相对 应 的 销售 总 町 ， 并 将 结 
时 按 销 售 总 额 从 大 到 小 的 顺序 排列 ， 最 后 仅 保 留 那些 销售 总 额 至 少 有 900.00 的 顾客 -代理 商 对 。 


select ccname, c.cid, a.aname, a.aid, sum{o,dnllars) a5 casales 
from customers €, GPFders O00, agents a 
Where Ceid = ocid drd o.aid = a.aid 
group by ec,ename, C.cid,. a.aname, a.aid 
havjing sumto.dotlars) >= 900.00 
order by casales desc: 


在 CORACLE 中 ， 该 查询 返回 下 面 的 表 : 
me ee | rane | 210 [casones | 


roves | co0r om | a05 | i4000” 


注意 ， 该 Seject 语 名 结尾 部 分 的 句法 : order by casales desc。 这 里 使 用 关键 词 
DESC 是 因为 我 们 想 把 具有 最 大 销售 总 额 的 结果 行 排 在 最 前 面 。 注 意 ， 在 上 述 Select 语 句 中 使 
用 形 如 order by sumto.doliars}) 的 ORDER BY 子 可 在 所 有 的 数据 库 中 都 是 行 不 通 的 。 
要 使 该 Select 语 名 在 所 有 的 数据 库 中 都 有 效 ，ORDER BY 子 句 的 结果 列 必须 由 列 号 或 者 选择 列 
表 所 包 会 的 列 名 或 别名 来 指定 。 国 


珊 在 是 对 构成 搜索 条 件 的 基本 语法 对 象 进 行 更 精确 的 定 愉 的 好 时 机 。 下面 ,我 们 将 回顾 
前 面 已 介绍 过 的 一 些 概念 ， 但 这 里 要 从 更 严格 的 角度 来 阐述 。 

1. 标识 蔡 

一 般 的 SQL 标识 符 是 大 小 写 无 关 的 。 实 际 上 ，S$SQL 在 使 用 标识 符 的 时 候 都 要 把 它们 转化 
成 大 写 形 式 。 所 以 , 键 人 select PID from Customers 或 者 select PiD from 
CuStomErs 所 得 的 结果 是 相同 的 。 一 个 标识 符 必 须 以 一 个 字母 打头 ， 之 后 则 可 以 包含 字母 、 
数字 或 下 划 线 。Entry SQL-92 和 Core SQL-99 将 一 个 标识 符 的 字 节 数 限制 在 18 个 以 内 。SQL 在 
解释 关键 词 【select、from 等 ) 以 前 也 会 把 它们 转化 成 大 写 形式 ， 

如 果 要 声明 符合 某 种 模式 的 实例 或 者 使 用 某 些 特 殊 符号 ， 那 可 以 用 另 一 种 被 称 做 定 界 标 
识 罕 【delimited identifier ) 的 标识 符 格式 ，Entry SQL-92 和 Core SQL-99 都 支持 这 种 格式 。 这 
类 标识 符 被 双 引 号 包围 着 ， 而 双 引 导 说 明 标 识 符 名 本 身 般 是 它 所 代表 的 内 容 ， 也 就 是 涪 ， 必 
须 按 名 字 的 字面 意义 来 使 用 这 类 标识 符 。 尽 管 一 般 的 SQL 标识 符 不 能 包含 宅 格 或 其 他 特殊 学 
符 【 除 了 下 划 线 )， 但 定 界 标识 符 却 可 以 。 本 文 不 使 用 这 种 格式 ， 但 有 个 地 方 使 用 它 会 显得 
特别 方便 ， 那 就 是 在 显示 结果 时 用 它 米 定 交 列 别 名 ， 如 下 所 示 : 


select surigqty) as "ToLdl guantity of produoct pOi"from crders wnere pid - PoOiI ' :; 


















章 3 音 专 赤 SO7L 查 将 语言 97 


2. 表达 式 、 谓 词 和 搜索 条 件 

搜索 条 件 是 WHERE 子 句 中 用 于 删除 某 些 行 以 及 HAVING 子 名 中 用 于 删除 某 些 组 的 条 件 : 
就 图 3-15 所 列 的 求解 步骤 而 言 ， 一 行 能 在 步骤 2 得 以 保留 或 者 一 组 能 在 步骤 4 得 以 保 曾 当 是 仪 
当 该 行 或 该 组 使 得 相应 的 搜索 条 件 等 于 TRUE( 真 }。 

首先 介绍 被 称 做 表达 志 (expr ) 的 语法 对 象 : 数值 表达 式 、 串 值 表达 式 以 及 诸 如 日 期 值 表 
达 式 之 类 的 其 他 类 型 的 表达 式 【如 果 革 个 产品 支持 的 话 )， 等 等 。 我 们 称 为 expr ::= 
numexpr | Strvexpr | datexpr |..-。 数 值 表 达 式 和 串 介 表达 式 是 出 现 频 率 最 起 的 表 
达 式 并 且 是 基本 SQL 的 -部 分 :表达 式 通常 出 现在 搜索 条 件 中 。 例 旭 ， 在 形 如 x.deollars 
>100 的 属性 值 ( 某 -一 行 的 ) 和 常数 的 比较 中 ，x .dol1ars 和 100 剖 是 简单 表达 式 。 下 面 定义 
的 表述 式 也 能 出 现在 Select 语 句 的 选 拌 列表 中 numexpr 是 一 个 由 常数 、 站 局 性、 算术 运算 符 、 
内 置 算 术 孙 数 以 及 集合 函数 所 组 成 的 算术 表达 式 。 稼 数 也 被 称 做 文学 (iteraD)。 图 3-16a 绽 出 了 
数值 表达 式 的 递归 定义 。 


数 他 直达 式 例子 





1. val， 常 音 或 变 基 6. ?NI, :percent 

2, 列 名 dollars, price, percent 

3. 限定 符 . 刀 名 Urders.dol lars, p.price 

4. 数值 表达 式 算术 运算 罕 数 值 

表 过 式 FDO 十 p-pr'ce 

5. (数值 表达 成 ) C7 00 + puprice] 

6, 数值 陌 数 ( 表 达 式 ) sqrtr? + a.percenty, char Irngthistr) 

7. 集合 晃 数 | 数值 直达 式 】 sumip. pricey} 

3, [ 运 回 单个 值 的 -了 查询 ) (select Maxfpercent} from agents) 

9 cast 表达 式 casttsubstringteid from 2 feor 3} as integer) 
10. case 表 这 式 ， Case wher price > 1 then price else 站 end 


图 3-16a 数 情 表达 式 (numexpr) 的 递归 定 头 


我 们 在 图 3-16a 中 看 到 了 一 些 新 的 语法 项 ， 出 现在 后 面 三 个 山 线 分 隔 的 框 中 的 语法 项 还 未 
在 一 些 重 要 的 产品 中 得 到 实现 而 且 不 是 我 们 所 指 的 基本 SQL 的 -一 部 分 ( 这 意味 着 它们 是 高 级 
SQL 的 -- 部 分 }。 不 过 ， 由 于 这 些 语法 项 是 Core SQL-99 的 一 部 分 ， 所 以 在 不 和 久 的 将 来 它们 很 
可 能 出 现在 几 个 主要 的 数据 库 产品 中 。 在 图 3-16a 的 第 一 行 ，: ”percent 代 表 腾 人 式 SQL 语 
铝 《 在 某 个 程序 中 运行 的 SQL 语句 ) 所 能 使 用 的 一 个 穆 序 变量 。 在 变量 名 前 面 加 冒号 是 为 了 
告诉 SQL 的 预 编 译 程序 该 名 字 代 表 了 一 个 程序 变量 。 

图 3-16a 的 第 6 行列 出 了 两 个 数值 函数 ( 返回 值 是 数值 型 的 ); sqrt 和 char_length， 我 们 还 在 
后 面 列 出 了 各 种 返回 其 他 类 型 值 的 晒 数 。 使 用 数值 型 或 字符 型 参数 的 函数 并 没有 完全 符 台 
SQL-99 标 准 ， 这 类 卫 数 有 时 被 称 答 标量 函数 以 区 别 于 集合 函数 。 存 Core SQL-99 中 ， 与 囊 有 
关 的 函数 是 char_iength ，substring 等 等 ; 这些 函数 在 Entry SQL-92 中 是 不 做 要 求 的 。 数 据 库 产 
品 通常 把 char_length 称 做 length 并 称 substring 为 substr。 搂 收 并 返 加 数值 的 冰 数 通常 被 称 为 数学 
当 数 ， 它 们 的 特性 在 很 大 程度 上 与 其 体 产 品 有 关 ; 在 所 有 这 些 产 凯 中 ， 只 有 abs( ) 和 modl ) 被 
写 进 了 SQL-99 标 准 ， 而且 只 属于 扩展 功能 。 参 见 图 3-17 中 的 例子 。 
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只 有 当 图 3-16a 第 8 行 括号 中 的 子 查询 返回 数值 型 的 单 值 时 ， 整 个 形式 才 算 得 上 是 数值 表 
达 式 。 初 级 SQ1L-92 不 要 求 这 种 表达 式 形式 ， 而 某 些 产品 可 能 也 不 是 在 有 所 有 能 使 用 表达 式 的 地 
方 都 支持 它 。 所 以 ， 它 不 在 基本 SQL 中 。 我们 将 在 3.419 节 之 后 的 “作为 表达 式 的 标量 子 查询 ” 
部 分 进一步 讨论 这 一 问题 ， 那 里 会 列 出 WHERE 子 句 形式 的 某 些 重要 细节 ， 

图 3-16a 第 9 行 的 cast 表 达 式 以 一 种 类 型 的 值 为 参数 并 把 它 显 式 地 转化 为 另 一 种 类 型 。 这 在 
C 和 Java 中 是 通过 写 (casti valLue 来 实现 的 ， 这 里 的 east 是 类 型 名 。 

除了 产生 的 结果 是 单 值 以 外 ，case 表 达 式 都 使 人 联想 到 C 语 言 或 Java 中 的 switeh 语句。 化 
的 通用 形式 如 下 : 

CASE 


HHEN search conditionl THEN resultl 
WHEN seareh condition2 THEN resulte 


WHEN search_conditionMS THEN resultN 
ELSE raesult(iN+l} 
END 


CAST 和 CASE 都 还 不 是 基本 SQL 的 一 部 分 ,但 它们 已 变 得 相当 普及 并 月 是 Core SQL-99 
的 一 部 分 。 注 意 ， 什 NUL 并 不 能 算 表 达 式 ， 但 在 一 些 使 用 表达 式 的 地 方 也 可 以 使 用 值 NULL。 
同 图 3-16a 灶 numexpr 定 头 一 样 ， 图 3-16b 定 六 了 一 个 毕 值 表达 式 strvexpr。 














"Boston”， "TipTop', :cityname 


1. Val! 常量 或 变量 
2. 列 公 
3. 限定 符 . 列 光 
4. 申 值 表达 式 运算 符 中 值 表 
达 式 





Cid ， an 前 已 








orders.cid, 8.city 










oa.cid | 全 Boston” (concatenate two strings with 4 







s.( 串 值 表 达 式 ) (to.cid ||'Beston’) 


6. 串 值 阔 数 (表达 式 ) 






substringto.cid ||’Boston’ from 7 for 4) {= "ston') 



































7. 集合 函数 ( 串 值 表达 式 ) | . 四 
8 (返回 单个 什 的 子 查询 ) tselect maxtcity) from agents) 
em | sasttoety ascarl 
10 case 表达 式 case when city > ‘Atl1!' then city else ‘Atlanta' end 











HE veo 一 一 





a 一 verorr 人 rr 一 


图 3-16b 时 值 表 村 式 的 递归 定 光 【strvexpr ) 


图 3-16b 第 4 行 的 串 接 运算 符 (11) 在 Full SQL-92 和 Core SQL-99 以 前 还 不 属于 任何 标准 ， 
但 它 已 在 数据 库 产品 中 得 到 了 广泛 的 实现 。 图 3-17 列 出 了 由 本 书 所 涉及 的 数据 库 产 品 提供 的 
一 些 数学 函数 。 和 参见 本 章 结 尾部 分 列 出 的 特定 产品 文档 以 获得 更 完整 的 函数 列表 通 弟 被 编 
录 在 标题 “函数 ”下 )。 

除了 图 3-17 所 列 的 函数 以 外 ，ORACLE 、INFORMIX 和 DB2 UDB 还 实现 了 三 角 函 数 、 指 
数 隐 数 、 对 数 函 数 、 田 阻 数 和 round(n)。 在 其 他 隐 数 中 ，ORACLE 和 DB2 UDB 实 现 了 ceil(n)、 
floor(n)y 和 sign(n)}。 图 3-18 分 别 列 出 了 标准 的 以 及 与 特定 产品 有 关 的 串 处 理 函 数 。 
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absin) n 的 绝对 值 , n 基数 值 型 的 


modtn,. b) n 被 b 除 以 后 得 到 的 傈 数 ，n 和 均 为 整数 


sartin) n 的 平方 根 ，n 是 整数 或 浮 操 数 





图 3-17 ORACLE、INFORMIX 和 DB2 UDB 中 的 一 些 数学 明 数 


Car SELL 0 中 的 描 坏 和 形式 CRACLE 


返回 审 的 长 度 (整数 个 字符 ) 


HARR_LENGCLTH!Str} 








INFORMIX 


length({stry, 
char lengthtstr) 






















lengthtstr} Tengthtstry} 









撑 癌 品 st= 的 子 串 ， 从 第 m 个 字符 到 是 
束 | 或 者 长 度 -.] ， 

STESTRING SI FROK m FORIT.) 
返回 将 st 点 掉 左 端 或 石 端 之 后 得 到 
的 也 半空 格 :或 者 任意 的 字符 集 ; 的 趾 ， 
TRIM Tt .LEADING 
工艺 上 [NMC BOTH 
‘| [seL]ERDM1SLELT) 
上 是 回 串 sFr2 在 st<1L 中 出 现 的 起 阅 亿 
汗 1 束 数 )， 对 str1 从 头 开 始 搜 索 或 者 
如 果 指 定 了 在 喃 ma， 从 第 n 个 个 置 开始 
搜索 ，PPCSITICN {str: TN str2} 


suUubstristr.m 
[5 ,n]): 

substringLt str 
from m tor nN} 













SU 日志 七 丫 和 让 ,用 
[.n}t 






substristr,m[,n]) 



















trimt[Eleading | 
trailing | bothj 

[set] from] str), 
1trimtstr C .set}}, 
rtrimistr [,set]’ 











trimt[[leading 
trailing | both] 
[set] from} str) 


itrimistry., 
rtrimtstr} 






































posstrtstril, 
stre [ ,ni1) 


instr tstrl,str2 
[ .n]) 














Toweristry Tcasetstr} 1 owertstry 





返回 由 小 写字 地 组 成 将 纠 ，LOWER 1stri 









uppertstry 机 它 诗 二 所 丰 站 六 upper(str} 


返回 由 去 写字 寺 组 成 的 由，UPEFER {str) 





图 3-18 一 些 标准 的 以 及 与 特定 产品 有 关 的 册 好 理 函数 


图 3-18 中 的 串 处 理 函 数 在 不 同 的 产品 中 具有 不 同 的 名 字 代 实现 的 功能 吉大 体 相 间 。 可 能 
在 不 久 的 将 来 ，Core SQL-99 的 形式 将 出 现在 大 多 数 产 品 中 。 在 所 有 这 些 函 数 中 ， 有 两 个 疗 
数 将 返回 整数 ， 这 意味 着 它们 是 数值 晴 数 {图 3-16a 中 的 数值 孙 数 ) ; 剩余 的 东 数 都 磊 串 仁 滑 
数 ( 图 3-16h 中 的 串 值 函数 ) INFORMIX 提 供 了 一 种 被 称 做 subscripting 的 求 子 毕 运算 以 友 一 
个 求 子 串 函数 。 例 如 ， 为 了 得 到 由 c .cid 的 最 后 三 个 (从 位 置 2 到 位 置 4) 字符 组 成 的 于 中 ， 
我 们 使 用 c.cia[2,4]。 除 了 表 3-18 所 列 的 图 数 以 外 ，ORACLE、DB2 UDB 和 INFORMIX 坏 
实现 了 在 串 中 蔡 换 子 串 以 及 为 子 捉 填充 空白 符 或 其 他 宇 符 的 图 数 。 

我 们 的 基本 SQL 标准 (以 及 Cere SQL-99 标 准 ) 包含 了 七 种 谓词 ， 它 们 基 轩 辑 子 铝 的 最 简 形 
式 。 图 3-19 列 出 了 这 些 谓词 的 形式 以 及 相应 的 例子 。 在 GROUP BY 或 HAVING 子 句 中 ， 七 们 表 
现 出 来 的 值 为 TRUE(T)、FALSE(E) 或 UNKNOWN(U)。 我 们 将 简要 地 说 明 小 人 UNKNOWN 值 
的 动因 
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比较 尊 谭 exprl 自 人 expra | ISubonery)} P.price >》【Subquery ) 


BETWwEEN 抽 前 exprl [NOT] BETWEEN expr2 and | c.discnt between 10 and 12.0 
Expry ， 


夸 化 请 词 expr EALL IANY] (Subquery) cdiscnt >=all {Subquery? 


IN 听闻 expr [NOT] IN Subquery) pid in (select pid from orders) 


eid, aid} in 【select cidg, 
(参见 例 3.4.6 中 的 变 体 形式 ) ai 和， 
expr [NOTI IN eval {, val...}} city in 【New YoOrK Duluth') 
EXISTS 谢 记 INOT] EXISTS (Subquery) Exists (select * ,..) 
IS NULL 认 词 colname I5 [NOT] NULL cdiscnt is null 


LTKEE 调 订 colname [VOTELIKE val crame 11ke ‘A%' 
[ESCAPE vall 





图 3-19 对 所 有 产品 【也 就 是 对 基本 SQL ) 都 有 效 的 标准 谓词 


这 些 谓 词 中 的 大 多 数 我 们 已 在 以 前 遇 到 过 ， 新 的 谓词 会 在 后 面 得 到 介绍 .基本 SQL 人 允许 
在 图 3-19 中 任何 出 现 expr 的 地 方 使 用 NULL。 但 如 例 3.7.8 所 示 ，NULL 往 往 会 产生 一 些 意 想 森 
到 的 局 条 .南面 我 们 说 过 ，NULL 本 身 并 不 算 表 达 式 。 有 关 表 达 式 【数值 类 琐 和 串 值 类 型 ) 的 
定义 从 见 图 3-16a 和 3-16b。 这 两 张 图 的 第 一 行 都 对 图 3-19 中 的 val 做 了 定 头 ， 即 常数 或 者 来 自 
调和 人 入 式 程序 (包含 了 髓 入 式 SQL 庄 句 的 程序 } 的 变量 {第 5 童 的 内 容 )。 

在 某 些 情况 下 ， 什 么 才 算 表达 式 取决 于 数据 库 系 统 是 否 实现 了 固 3-16a 和 3-16b 中 的 第 8、9 
和 10 行 所 示 的 新 功能 ， 即 返回 单 值 的 子 查询 、CAST 以 及 CASE。 只 需 做 一 个 实验 或 查阅 一 -下 
SQL 手册 就 可 以 确定 数据 库 系 统 是 否 支 持 CAST 或 CASE。 比 较 难 检验 的 是 子 查询 。 

3. 作为 表达 式 的 标量 子 查询 ， 高 级 SQL 

标 基 子 查询 是 返回 值 为 单 值 而 不 是 由 多 行 或 多 列 组 成 的 集合 的 子 查询 。 如 图 3-16a 和 3-16b 
所 示 ， 高 级 SQL (以 及 Core SQL-99， 但 还 不 是 基本 SQL ) 把 子 查询 当 作 … 种 正式 的 表达 式 构 
造 部 什 ， 我 们 下 期 竺 着 能 以 多 种 方式 来 使 用 这 种 新 的 功能 。 

"目前 ，DB2 UDB、INFORMIX 和 ORACLE 人 允许 将 标量 子 查询 用 作 选 择 列表 中 的 表达 式 ， 

例如 : 

select cld, fselect maxtoty) from orders o where o.cid = .cid) 


from customers cc: 


* 基本 SQL 不 允许 将 标量 子 查 询 用 作 WHERE 子 身 中 的 表 这 式 ， 例如 : 


select cid from customers 
where tselect maxtdqtyy from orders 0 where ocid = c.cid) > i100: 


注意 ， 图 3-19 中 其 杂 六 个 出 瑰 expr 地 方 ， 它们 的 用 法 是 类 似 的 。 卓 前 的 DB2 UDB 和 
ORACLE 都 允许 上 面 的 第 二 种 形式 。 最 后 要 注意 ， 将 这 里 的 高 级 SQL 表 达 式 语法 与 图 3-11 中 
的 高 级 SQL tableref 语 法 作 比 较 之 后 ， 我 们 会 发 现 : 尽管 tableref 语 法 也 涉及 到 了 ( Subquery ) 
这 种 形式 ， 但 那 蛙 的 子 查询 可 以 返回 完整 的 行 集 ,“ 导 出 表 "。 

有 了 图 3-19 的 谓词 以 后 ， 我 们 就 能 递归 地 定义 搜索 条 件 了 ， 如 图 3-20 所 示 。 


入 了 划 大 太 SOL 查 前 请 言 10 


谓 问 tpid = ‘pOl'. exists {Subquery} 
搜索 条 件 io.pid = “pol') 


NOT ”搜索 条 样 net exists (Subquery) 
拖 索 茶 什 点 NED 搜索 亲人 忻 not fo.pid = ‘pO1') and o.cid ~ ‘coO01' 
搜索 茶 件 OR 搜索 条 桩 not fo.pid 一 pb) or o.cid = COD1' 





图 3-20 搜索 条 件 {ssarch_condition) 的 弟 由 兴 浆 


到 上 自前 为 止 ， 我 们 已 讲述 了 SQL 的 所 有 谓词 以 及 以 这 些 请 词 为 构造 部 件 的 逻辑 搜索 条 件 。 
待 我 们 完全 解释 了 这 些 请 词 的 含义 之 三 ， 创 建 伍 何 可 能 的 搜索 条 件 应 该 不 再 是 一 件 难 事 。 

4. 基本 SQL 与 高 级 SQL: 总 结 

在 这 一 音 早 ， 我 们 定义 了 基本 SQL 一 一 一 种 出 现在 绝 大 多 数 重 要 DBMS 产 品 (包括 
ORACLE、DB2 UDB 和 INFORMIX ) 中 的 SQL 语法 。 基 本 SQL 与 Entry SQL-92 和 X/Open 版 本 
2 标准 的 关系 相当 密切 【参见 本 音 结 尼 部 分 的 “推荐 读物 ”)。Core SQL-99 标 准将 Entry SQL- 
92 扩 展 到 了 略微 超过 我 们 所 定 尽 的 基本 SQL 的 层次 上 ， 这 为 数据 库 生 产 广 商 将 来 要 实现 的 功 
能 提供 了 指南 ,但 我 们 的 指导 原则 是 当前 的 可 用 性 .基本 SQL 包 括 了 本 荤 所 介绍 的 除 高 级 
SQL 芒 能 以 外 的 所 有 SQL 语 法 ; 这 些 特征 是 SQL-99 标 准 的 一 部 分 ， 它们 可 能 不 在 Core SQL-99 
中 ， 但 已 被 一 些 生 产 厂 次 采 用 。 我 们 已 在 3.6 节 “高 级 SQL 语 法 ”、 图 3-16a 和 3.16b 中 的 被 横 线 
分 隔 的 方 框 以 及 上 一 小 节 “ 作 为 表达 式 的 标量 子 查 询 ; 高 级 SQL” 中 介绍 了 高 级 SQL 语 法 。 
如 果 要 查阅 有 关 语 法 扩展 的 更 多 信息 ， 可 参见 附录 C。 基 本 SQL 在 产品 之 间 有 相当 太 的 可 移植 
性 : 唯一 需要 我 们 查阅 产品 交 档 的 语法 变化 只 有 羽 不 同方 式 人 靖 名 的 申 操 作 匡 数 (图 3-18) 以 
及 空 值 的 排放 位 置 ( 大 多数 产品 将 空 值 排 在 高 位 而 某 些 产品 则 将 它 排放 在 低位 )。 用 于 描述 语 
法 元 素 的 术语 在 不 同 产品 之 间 的 差异 ， 如 “和 条件 ” 与 “谓词 ”等 ， 比 这 些 产 品 的 实际 语法 之 
间 的 差别 要 明显 得 多 。 

5. 关于 谓词 的 讨论 

《1) 比较 谓词 

比较 谓词 的 形式 为 : 


exprl 8 [expr? | (Subquery)} 


其 中 的 6 是 集合 {=,<>,>,>=,<,<=} 中 的 一 个 元 素 . 注意 ， 在 绝 大 多 数 数据 库 系 统 产品 中 ， 
不 等 ( <> ) 也 可 用 (1=) 或 (^=) 来 表示 ,但 我 们 相信 ( <> ) 是 最 通用 的 形式 。8 的 右边 可 以 出 
现 了 于 查询 形式 仅 当 该 子 查询 检索 到 的 结果 是 单 值 或 空 集 。Core SQL-99 把 这 种 形式 推 三成 
expr18 expr2， 其 中 的 两 个 表达 式 都 可 以 包含 由 括号 包围 的 子 查询 ( 除 子 查询 外 可 能 还 会 
有 其 他 - 些 表达 式 元 素 ), 不 过 , 在 写 这 本 书 的 时 候 还 很 少 有 数据 库 产品 实现 了 这 种 捧 广 形式 。 
图 3-19 所 列 的 其 他 子 查询 形式 在 SQL-99 中 没有 得 到 推广 。 

例 3.9.2 ”回顾 例 3.7.5: 列 遇 了 折扣 值 小 于 最 大 折扣 值 的 所 有 顾客 的 cia 值 。 我 们 可 以 使 


用 查询 : 
select cid From customers 
where discnt < tselect maxtdiscnt) from customers): 图 
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因为 子 查 询 只 检索 到 一 个 单 值 。 我 们 也 可 以 使 用 谓词 <ANY 或 <ALL-。 国 


如 果 比 较 谓 词 右边 的 子 杏 询 的 结果 是 一 个 空 集 ， 那 么 以 exprl 6( Supquery } 这 种 形 
式 出 现 的 比较 谓词 将 等 于 UNKNOWN(GU)。 如 果 在 比较 谓词 的 任何 一 边 (或 者 说 两 边 ) 出 现 了 
空 值 ， 那 么 也 会 时 致 UNKNOWN 的 结果 ， 我 们 已 在 例 3.7.8 的 Select 语 句 中 看 到 了 这 -点 : 

select * from customers Where discnt ss ]0 or discnt > 10; 

在 其 中 的 customers 表 中 ， 有 一 行 在 aiscnt 列 上 的 值 为 空 : 我 们 将 在 下 一 市 里 解释 引 
人 布尔 值 UNKNOWN 的 动因 。 

{2) 真 值 : TRUE(TJ、FALSREIUP) 和 和 UNKNOWNIDU) 

在 WHBERE 子 句 中 进行 测试 的 特定 行 {或 在 HAVING 子 名 中 的 组 ,但 后 面部 假定 在 
WHERE 子 句 中 ) 可 能 使 请 词 等 于 UNKNOWN， 这 基本 上 意味 着 在 测试 该 行 的 时 候 产 生 了 空 
值 或 空 的 于 查询 。 所以， 如 果 该 谓词 网 成 了 整个 搜索 条 件 ， 那 么 说 明 提 交 该 查 词 的 人 可 能 不 
希望 这 一 行 被 检索 到 。 比 如 : 如 果 有 一 个 Select 语 钊 ; 

Select * from customers where discnt < 《3UbouUeEryTi: 

而 且 其 中 的 子 查 交 将 返回 一 个 空 集 或 者 单个 空 值 ， 那 么 我 们 不 可 能 检索 到 任何 行 。 由 于 行 
能 被 检索 到 当 且 仅 当 它 使 得 搜索 条 件 等 于 TRUE， 所 以 ， 从 这 个 意义 上 来 说 ,新 引入 的 真 值 
UNKNOWN 就 等 价 于 FALSE 。 

. 然而 ，UNKNOWN 不 可 能 在 所 有 的 情况 下 都 等 价 于 FALSE。 考 虑 由 值 为 UNKNOWN 的 谓 
词 的 逻辑 混合 运算 构成 的 搜索 条 件 。 例 如 ， 如 果 我 们 把 上 而 提 到 的 Select 语 句 改 成 : 


se Tect < from customers Where not fdiscent < {Subquery}): 


并 且 谓 词 aiscnt< {Subquery) 的 结果 仍然 为 UNKNOWN ， 想 一 想 该 语句 会 有 什么 结果 ? 
我 们 认为 not tidiscnt<(Subquery)) 等 价 于 discnt>={Subquery)， 而 
digcnt>= {Subgquery) 理所当然 应 该 等 于 UNKNOWN， 因 为 discnt< {Subquery}) 等 于 
UNKNOWN。 这 正 说 明了 为 什么 需要 UNKNOWN 值 :因为 如 果 当 子 查询 返回 一 个 空 集 时 谓词 
discnt<tSubquery) 等 于 FALSE， 那么 根据 正常 的 逻辑 规划 ,， not (discnt< 
{Subquery) ) 将 等 于 TRUE! 这 不 是 我 们 所 希望 的 结果 。 于 是 ， 一 个 新 的 真 值 UNKNOWN 便 
诞生 了 ， 并 日 具有 性 质 not(UNKNOWN) = UNKNOWN。 图 3-21 列 出 了 在 逻辑 运算 中 的 二 个 真 
值 一 一 TRUE(T)、FALSE(F) 和 UNKNOWN(U) 的 完整 运算 规则 。 





图 3-2t UNKNOWN 值 在 逻辑 运算 中 的 表现 


在 这 一 节 里 ， 我 们 说 明了 在 计算 各 种 谓词 的 过 程 中 产生 真 值 UNKNOWN 的 情况 。 这 在 茶 
些 Select 清 名 中 会 有 和 相当 惊人 的 效果 ， 我 们 将 在 本 章 结 尾部 分 的 习题 中 探讨 这 一 问题 ， 

(3) BBTYWEEN 亩 词 

BETWEEN 谓 词 测 试 一 个 值 是 否 在 由 另外 两 个 值 限定 的 范围 内 。 它 的 形式 为 ; 


exprl LNOTY BETHEEN expre and expr3 


各 了 章 甚 表 SOL 查 声 语 言 703 


其 舍 义 【不 考虑 NOT ) 实际 上 上策 好 比 我 们 瑟 了 : 


Expra <= Exprl and exprl < EXPT 


如 果 包 含 了 关键 词 NOT， 那 雪原 先 的 值 不 在 限定 的 范围 内 时 谓词 的 结果 值 为 TRUE。 提 供 
这 种 形式 最 初 是 因为 使 用 BETWEEN 谓词 的 表达 式 比 它 的 等 价 形式 一 一 由 AND 连 接 的 两 个 比 
较 谓 词 具 有 抱 高 的 计算 效率 。 这 条 规则 已 不 再 适用 于 所 有 的 产品 ,但 每 当 必 须 声 明 一 个 具有 
两 个 端点 的 约束 范围 并 且 发 生 了 从 一 个 产品 到 另 一 个 产品 的 可 移植 性 问题 时 ， 出 于 性 能 的 原 
因 ， 我 们 应 假定 该 规则 成 立 。 

(4) 量化 比较 谓 启 

以 如 下 形式 出 现 的 基 化 诈 词 的 含义 已 在 3.4 节 中 得 型 了 介绍 ， 但 我 们 仍 需 对 特 萄 的 
UNKNOWN 值 计算 作出 定义 。 

expr A ESOME | ANY | ALLY {Subquery) 

expr 9 ALL (Subquery} 的 结果 为 FALSE 当 且 仪 当 比 较 的 结果 对 子 查询 所 返回 的 至 少 一 - 
个 值 为 FALSE。 山 此 可 推 得 ; 整个 谓词 的 值 等 于 TRUE 当 且 仅 当 比较 6 的 结果 对 检索 到 的 每 一 
个 值 玖 为 TRUE 或 者 子 查询 的 结果 是 一 个 空 集 。 然 而 ， 如 果 左 边 表达 式 的 值 为 空 或 者 子 查询 至 
少 返 回 了 一 个 空 值 ， 那 最 后 的 结果 将 是 UNKNOWN，。 

当 比 较 6 对 检索 到 的 至 少 一 个 值 为 TRUE 时 ，expr 8 ANY {Subquery) 的 结果 为 
TRUE; 当 子 查询 的 结果 是 一 个 空 集 或 者 比较 的 结果 对 返回 的 每 -个 值 均 为 FALSE 时 ， 该 谓词 
的 结果 为 FALSE。 然 而 ， 如 果 志 边 表 达 式 的 值 为 空 ， 或 者 如 果 在 子 查询 所 返回 的 值 中 有 一 个 
为 空 值 并 且 托 较 的 结果 对 其 他 所 有 值 均 为 FALSE， 那 整个 谓词 的 结果 将 是 UNKNOWMN。 

下 面 ， 我 们 举例 说 明 : 当 子 查 漳 的 结果 是 一 个 空 集 时 ， 为 人 慎 委 谓词 expr 日 ALL 
{1Subquery}) 应 等 于 TRUE。 


例 3.9.3 检索 所 有 顾客 的 最 大 折扣 值 。 显 然 ， 我 们 可 以 用 下 面 的 查询 语 名 来回 管 这 一 问题 : 


521ect maxEdgiscnty fFrom cu stmners: 


但 我 们 想 要 举例 说 明 有 关 8 ALL 请 词 的 特点 ， 所 以 使 用 如 下 语句 。 


spelect distinct disent from customers c 
where disent Srall (select discnt from customers d 


where dd.cid < c.cidy.; 


用 语言 来 表述 就 是 : 我 们 所 要 检索 的 行 《 在 左边 ) 的 discnt 值 大 于 或 等 于 customers 
表 中 其 他 所 有 行 的 aiscnt 值 【一 个 相关 子 查 询 ), 如 果 customers 表 中 以 有 一 行 ， 那么 子 查 
询 将 检索 到 一 个 空 集 。 显然 ， 我 们 想 检 索 的 正 是 这 个 唯一 的 aiscnt 值 ， 因 为 它 就 是 最 大 的 ， 


这 就 意味 着 在 子 查询 检索 到 空 集 的 情况 下 搜索 条 件 的 谓词 应 等 于 TRUE。 组 
(5) IN 谓词 
IN 谓词 具有 如 下 形式 : 
expr [NOT] IN {{Subquery)|ival [Yal- 1] 


我 们 在 3.4 节 中 介绍 了 它 的 用 法 。IN 谓 词 等 同 于 =ANY 谓 词 。 在 例 3.4.6 中 ， 这 里 的 expPr 镀 
推广 成 一 个 包含 了 多 列 的 行 值 。val 的 定义 在 图 3-16a 和 3-16b 的 第 一 行 中 。 

(6) EXISTS 请 词 

EXISTS 谓 词 具 有 如 下 形式 : 
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[NOT] EXISTS tSubauery) 

它 只 有 当 子 查询 的 结果 不 是 空 集 时 才 等 于 TRUE,，3.4 生 介绍 了 该 谓词 的 用 法 。 在 任何 条 
件 下 该 谓词 都 不 会 等 于 UNKNOWMN。 

(7)IS NULL 请 词 

例 3.7.8 所 引信 的 IS NULL 谓 词 具 有 如 下 形式 : 


eoTrname TS [CHOT] NULL 


女 任 何 条 件 下 该 谓词 都 不 会 等 于 UNKNOWN， 

(8) LIKE 请 讨 

LIKE 是 新 引 人 人 的 谓 间 。 它 的 通用 形式 如 下 : 

colname [NOT] LIKE wal [ESTAPE vail] 

第 一 个 val 代 表 神 式 串 ， 它 通常 由 一般 宁 符 和 特 吻 字符 组 成 并 昌 被 引号 包围 着 。t 根据 图 3- 
16a 和 图 3-16b 中 的 val 和 定义， 它 也 可 以 是 一 个 程序 变量 ， 但 我 们 还 没 涉 太 到 这 类 程序 . ) 模式 串 为 
满足 某 种 特征 的 字符 串 值 构造 了 一 个 模板 。 下 面 列 出 了 包括 通配符 在 内 的 所 有 可 用 在 模式 串 中 的 
特殊 字符 : 


模式 申 中 的 字符 
下 划 线 (_) 任意 单个 子 符 的 通配符 
下 欠 导 ( 驶 ) 包 售 零 个 或 这个 字符 的 任意 序列 的 通配符 


转 文学 入 用 在 需 惨 按 宁 面 舍 习 引用 的 了 符 之 前 [在 下 而 说 明 ， 
所 有 其 他 宰 符 代表 它们 自己 





例 3.9.4 检索 cname 值 以 字母 “AA” 打 涉 的 顾客 的 所 有 信息 。 我们 输入 


stelect * from customers where cname Tike “上 六 ; 


它 运 加 如 下 表 : 


mr A os em 
















如 果 我 们 要 在 模式 串 中 按照 字面 贪 义 来 引用 特 呈 模 式 字 符 锡 和 _， 那 该 模式 蝇 必 有 扰 包含 一 
个 转 义 【Escape ) 字符 。 使 用 LIKE 谓 词 通用 形式 中 的 Eseape 子 句 ， 我 们 可 以 为 每 个 Select 语 句 
定义 不 问 的 转 义 字符 。 当 一 个 模式 包含 了 转 义 字符 时 ， 紧 随 其 后 的 字符 就 要 按 它 的 字面 含义 
来 使 用 。 

例 3.9.5 检索 cname 值 的 第 三 个 字母 不 等 子 “ 铝 ”的 顾客 的 cid 值 。 

select cid from customers where cname not like ” NY escape “3 

注意 最 后 的 珀 分 号 表示 允许 出 现 出 零 个 或 多 个 任意 字符 组 成 的 序列 。 三 

例 3.9.6 检索 cname 值 以 “Tip_” 打 涉 并 且 后 面 跟 着 任意 个 字符 的 蜂 客 的 cid 值 。 
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selert cid from customers where cname like TIP %' escape “7 

注意 最 后 的 卢 分 号 表示 允许 出 现 由 零 个 或 多 个 任意 字符 组 成 的 序列 。 天 

在 LIKE 谓 词 的 堪 式 中 ， 如 果 左 边 的 colname 呈 现 出 空 值 ， 那 对 当前 行 来 说 该 谓词 的 结果 
是 UNKNOWN. 

注意 ， 在 一 些 数据 库 产品 中 ， 某 个 转 义 字符 ， 比 如 +， 是 由 系统 来 选 定 的 。 对 所 有 的 转 义 
字符 都 适用 的 规则 是 : 如 果 希 望 菜 个 转 义 字符 以 其 宁 面 含义 出 现在 模式 串 中 ， 那 么 我 们 应 在 
同一 行 里 使 用 两 深 转 义 字 符 。 这 样 ， 如 果 + 是 转 义 字符 ， 那 么 ”++ 就 表示 在 任意 两 个 字符 后 
面 紧 跟着 字符 + 的 模式 捉 。 

例 3.9.7 检索 cname 值 以 夺 列 “abpv” 打 头 的 顾客 的 cid 值 。 我 们 可 以 输入 

select cid from customers where ename Tike "abi\,’ escape “": 

或 者 ,我 们 辣 以 选择 一 种 不 同 的 转 义 字符 或 根本 不 使 用 转 义 字符 : 

select cid from customers where cname 1]1ke ab'%". 


注意 最 后 的 百 分 号 表示 人 允许 出 现 由 零 个 或 多 个 任意 字符 组 成 的 序列 。 国 
3.10 Insert、Update 和 Delete 语 句 


我 们 用 三 种 SQL 语句 一 一 Insert、Update 和 Delete- 一 来 对 已 存在 的 表 执 行 修改 操作 ， 
Insert 寺 全 插入 新 的 行 ，Update 语 句 改 变现 有 行 的 信息 ， 面 Delete 语 句 则 删除 表 中 现 有 的 行 ， 
这 二 种 鸽 句 通常 被 统称 为 重 新 语 向 《update statement }， 因 为 它们 玫 起 到 了 更 新 表 的 作用 。 这 
里 有 混淆 概念 的 危险 ， 央 为 Update 是 其 中 一 种 语句 的 特定 和 名称， 而 我 们 需要 在 可 能 引起 混 清 
的 地 方 小 心地 区 分 两 个 update 所 指 的 具体 概念 。 比 如 : 要 清醒 地 认识 到 Update 语 和 句 仅 似 是 更 新 
语句 集合 中 的 一 员 。 为 了 在 一 个 特定 的 表 上 执行 Update 语 名 ， 当 前 的 用 户 必须 是 表 的 创建 者 
或 是 已 被 檬 子 『update 特 权 《update privilege ) 的 用 户 。 我 们 将 在 后 面 的 章节 中 介绍 授权 的 步 

1. Insert 语 向 

SQL 的 Insert 语 句 的 作用 是 往 现 有 的 表 中 插入 新 的 行 。 它 具有 图 3-22 所 显示 的 通用 形式 。 

Insert 语 句 将 新 的 行 插入 指定 的 表 中 。 我 们 必须 使 用 两 种 形式 中 的 一 种 ( 用 “或 运算 符 ”， 
| ， 来 表示 ): 要 人 么 是 VALUES 形 式 ， 即 揪 人 具有 特定 值 的 行 ; 要 么 是 子 查 询 形式 ， 即 插 人 由 
子 查 询 【 可 能 涉及 多 个 不 同 的 表 ) 返回 的 所 有 行 。 





INSERT TNTO tablename Licolname 1, colname...}}] 


(YALUES texpr | NULL {, expr | NULL. - .jy | Subquery] 





图 3-22 基本 SQL Insert 语 名 的 通用 形式 


例 3.10.1 往 orders 表 中 加 入 具有 特定 值 的 行将 qty 和 do11ars 列 设 成 空 值 。 有 上 山 种 
力 法 可 以 实现 这 个 插入 操作 。 
insert into orders {ordno, morth, cid, aid, Pid} 
values (31107， aug'. ‘CcOD6", "an04" ‘pOl'): 


就 该 insert 否 名 而 言 ， 在 执行 揪 人 操作 的 时 候 ， 由 于 还 不 知道 Sky 和 aqaellargs 的 值 ， 所 以 
我 们 既 次 布 在 列 名 中 也 没有 在 值 列 表 中 担 到 这 两 列 ， 它 们 将 缺 害 为 空 值 。 
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insert into orders ordno, month, cid, aid, pid. qty，doTiarsi 
yalues {1107, aug' ， ‘CcOO06, AGd4°. "pOl, null, nult): 


在 该 语句 中 ， 我 们 显 式 地 给 出 gty 币 Go11ars 的 空 值 。 国 


例 3.10.2 创建 一 个 名 为 swcusts 的 表 ， 它 包含 住 在 西南 部 的 所 有 顾客 ， 并 往 该 表 中 插 
入 所 有 来 自 Dallas 或 Austin 的 顾客 。 


create table sweusts tcid chart#y not null, chame vearchartl3}, 
city varchartz0), discnt real); -- Same a5 cuUstomers 


insert into swewsts 
seElect * from customers 
where city in "Dallas’, ‘Austih'}: | 


这 个 例子 说 明 Inserr 语 名 不 一 定 要 包含 接收 新 值 的 特定 列 的 名字。 省 略 了 列 名 就 相当 于 指 
年 表 中 所 有 的 列 并 且 列 的 硕 序 与 在 Create Table 语 名 中 定义 的 顺序 相同 ， 恕 果 像 例 3.10.1 那 样 
指定 列 名 ， 那 它们 就 不 一 定 要 按照 那 种 顺序 出 现 。 注 意 ， 例 3.10.2 中 的 Insert 请 名 ， 把 跟 在 表 
名 swcusts 后 面 的 子 查 询 放 人 括号 是 一 种 错误 的 做 法 (在 Entry SQL-92 和 许多 产品 中 )。 

这 种 由 于 查询 来 为 Insert 语 句 创 建 输入 数据 的 方法 大 大 增强 了 SQL 的 能 力 ,在 Insert 语 句 中 ， 
只 有 一 个 表 能 接收 新 的 行 ， 但 一 个 子 查询 却 可 以 作用 在 任意 数目 的 表 上 ， 只 要 它 能 产生 列 数 
以 及 每 一 列 的 类 型 均 正 确 的 数据 来 作为 要 搬入 的 新 行 。 

2. Update 语 名 

SQL 的 Update 二 句 用 于 改变 表 中 现 有 行 的 信息 。 它 具有 图 3-23 所 显示 的 基本 SQL 通用 形式 
(这 是 Entry SQL-92 形 式 的 扩展 )。 

Update 庄 句 将 表 中 所 有 满足 搜索 条 件 的 行 在 指定 列 上 的 值 兰 换 成 特定 表达 式 的 值 。 这 里 
的 表达 式 只 能 引用 在 表 的 某 个 特定 行 上 当前 正 被 修改 的 列 值 。 


UPDATE tablerame 
SET colname = {expr | NULL | tsubquery)]} 


{, colname = {expr | NULL | (subguery}...}} 
FWHERE search conditicon]: 





图 3-23 基本 SQL Update 语 色 的 通用 形式 
例 3.10.3 将 所 有 住 在 New Yerk 的 代理 商 从 每 次 订货 中 赚 得 的 佣金 自分 率 提高 10 双 。 
update agents set percent = 1 .1 * percent where city = ‘New York': 国 
利用 其 他 表 中 的 数据 来 判定 当前 表 中 哪些 列 需要 修改 可 通过 在 搜索 条 件 中 使 用 子 查询 
来 实现 。 
例 3.10.4 将 所 有 订货 总 额 超过 $1000 的 顾客 所 收 到 的 aiscnt 值 增 训 10 扩 。 


update customers set discht = 1.1 * discnt Where tid in 
{select cid Trom orders group by cid having sum{dollars} > 10007: 故 


注意 只 有 一 个 表 可 以 作为 Updare 语 名 的 对 象 。 有 些 数据 库 系 统 不 允许 在 SET 子 和 中 使 用 限 
定 属性 名 : 


一 
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Update agernts set agents.percent = . - -- we MAY BE TNYALID 

Entry SQL-92 中 的 Update 语 句 形 式 不 提供 SET 子 句 里 的 子 查询 。 这样 ， 在 insert 语 句 中 可 采 
用 的 一 种 方法 一 一 3 耻 用 其 他 表 来 导出 里 新 当前 表 所 和 天 的 数据 在 这 里 是 行 不 通 的 。 然 而 ，Full 
SQL-92 标 准 、Core SQL-99 标 准 以 及 ORACLE、INFORMIX 和 DB2 UDB 这 些 产 品 都 有 轩 对 该 
问题 的 Update 语 芭 扩 展 操 法， 所 以 我 们 将 这 项 特性 包括 在 我 们 的 基本 SQL 通用 形式 之 内 。 事 实 
上 ， 由 于 Core SQL-99 将 标量 子 查 询 妇 为 一 种 通用 的 表达 式 形 式 ， 所 以 ,把 图 3-23 中 的 | 
(subquery ) 选 项 去 掉 之 后 所 得 的 形式 就 是 该 语句 在 Core SQL-99 中 的 描述 形式 。 下 面 古 一 个 
使 用 该 语法 的 例子 。 

例 3.10.5 用 customers 表 中 最 新 的 4iscnt 值 来 更 新 例 3.10.2 所 创建 的 swcusts 表 中 各 
行 的 aiscnt 值 ， 


Update sweusts Set discnt = select discnt from customers where cid = swcusts.cid}: 辆 





3. Delcte 语 向 
SQL Delete 语 句 将 现 有 的 行 从 表 中 删 去 。 它 具有 图 3-24 所 显示 的 基本 SQL 通 用 形式 。 


DELETE FROM tableraime 
[WHERE search condition]: 


图 3-24 基本 SQL Delete 语 名 的 通用 形式 
例 3.10.6 删除 住 在 New Yerk 的 所 有 代理 商 。 


delete from agents where city = 'New York'; 辆 


同 前 面 一 样 ，Search_condition 也 可 以 包含 子 查 询 ， 这 就 允许 我 们 利用 其 他 表 中 的 数据 来 
判定 哪些 行 要 从 当前 表 中 删 去 ， 
例 3.10.7 删除 总 订货 金 萄 小 于 $600 的 所 有 代理 商 。 


delete from agents where aid in 
{select aid from orders group by aid having sumtdol lars} < OO); 辆 


3.11 Select 语 句 的 能 力 


过 程 性 语言 (procedural language ) 是 指 用 该 语言 编写 的 程序 应 写 明 完成 某 项 任务 的 有 序 
指令 序列 。 语 句 的 顺序 是 很 重要 的 ， 因 为 我 们 可 以 认为 排 在 前 面 的 语句 具有 长 远 的 影响 ， 即 
它 是 后 面 语句 正确 执行 的 先决 条 件 。 比 如 ， 如 果 希 望 建立 一 个 循环 来 对 一 串 输 入 的 变量 值 Y 求 
和 和， 我们 首先 会 设 定 SUM = 0， 然 后 当 循 环 不 断 进 行 的 时 候 语 名 SUM = SUM + VY 会 逐渐 地 增 
加 这 个 总 和 。 这 里 至 关 重 要 的 -点 是 把 语句 $SUM = 0 放 在 循环 开始 以 前 而 不 是 循环 中 间 的 某 
个 地 方 。 为 了 获得 正确 的 结果 而 必须 按 特定 的 顺序 来 使 用 一 系列 语句 的 特性 可 被 认为 是 证 明 
了 语言 的 过 程 性 【procedurality )。 

相反 ， 非 过 程 性 语言 (non-procedural language ) 是 指 用 该 语言 编写 的 程序 直接 描述 了 所 
期 望 的 结果 。 这 意味 着 我 们 必须 指明 期 望 做 什么 而 不 是 怎么 司 才 能 实现 目标 ， 而 且 程 序 的 各 
语句 之 间 也 不 存在 着 需要 程序 员 米 考虑 的 隐 和 会 顺序 。 这 种 非 过程 性 语言 的 一 个 典型 例子 是 一 
个 由 说 幕 菜单 组 成 的 界 而 ,在 这 个 界面 上 ， 有 用户 通过 选择 一 些 选项 来 完成 菜 项 任务 选择 的 
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顺序 是 无 关 紧 要 的 )， 然 后 按 下 执行 [Execute) 键 。- : 些 拥护 关系 模型 的 早期 书 作者 将 非 过 程 考 
视 为 一 个 至 关 重 要 的 目标 。 在 那 以 前 的 数据 库 语 言 通 常 需要 数据 导航 。 作 为 一 个 简单 的 例子 ， 
考虑 上 和 面 提 到 的 对 一 申 输 入 值 Y 求 和 的 程序 。 如 果 将 这 些 值 视 为 来 自 一 个 文件 ， 那 当 执 行 一 个 
循环 来 求 和 时 ， 在 从 头 到 尾 读 挨 数据 的 同时 我 们 始终 保持 着 一 种 游标 一 一 我 们 知道 哪些 值 已 
被 计 人 总 和 而 哪些 值 还 没有 一 一 所 以 每 个 程序 语句 都 看 - -个 预先 存在 的 上 下 文 环境 。 关 系 模 
型 的 拥护 者 们 指出 : 许多 潜在 的 数据 库 用 户 (比如 金融 专家 、 房 产 经 纪 估 种 律师 ) 可 能 无 法 
胜任 通过 编写 循环 程序 来 获取 信息 这 项 工作 。 如 果 预 先 编制 的 针对 他 们 需求 的 某 个 程序 没 能 
提供 他 们 起 要 的 信息 ， 那 他 们 就 只 能 自 认 倒 雷 了 ， 更 何况 他 们 想 要 执行 的 许多 查询 很 可 能 无 
法 提前 预知 ， 这 样 的 查询 属于 即席 查询 ， 即 它们 源 于 紧急 的 需求 并 且 不 可 能 用 预先 编 好 的 程 
序 来 解决 。 

上 面 所 说 的 日 标 就 是 要 提供 一 种 能 寻 理 即席 请 求 的 查询 语言 ， 提 供给 用 只 一 种 提 山 与 数 
据 有 关 的 单个 问题 的 能 力 。 这 个 单个 问题 可 能 会 相当 复 杀 ,但 即便 如 此 ， 查 询 语 言 也 点 避 人 多 
这 种 需要 程序 员 来 处 理 的 过 和 柏 复杂 性 。 符 号 滥 辑 的 研究 朴 乎 与 这 一 目标 (设计 数据 库 语 言 
相关 ， 我 们 在 第 2 章 里 提 到 ，E :FF : Codd 指出: 建立 在 一 阶 谓 词 演 并 {first-order predicate 
calculus )《 符号 逻 辑 的 一 种 类 型 ) 基础 上 的 关系 代数 有 具备 了 一 种 语言 所 拥有 的 全 部 能 方 。 从 
这 一 结论 出 发 ， 在 确定 一 种 标准 的 数据 库 语 言 的 过 程 中 产生 了 许多 问题 。 其 中 的 一 个 问题 是 
该 语言 县 有 什么 程度 的 非 过 程 性 一 一 没有 一 种 复杂 的 语 点 在 这 方面 是 完 匡 无 缺 的 ， 但 总 有 一 
此 语言 会 比 男 -- 些 强 一 点 。 达 有 一 个 问题 就 是 该 语言 共有 多 大 的 能 力 。 基 十 Codd 的 结论 ， 具 
备 关系 代数 全 部 能 四 的 语言 应 被 定义 为 完备 的 或 首 甘 系 完 备 的 ， 而 这 也 暗示 了 -种 衡量 语言 
的 重 昌 标准。 尽管 如 上 此， 我 们 伟 会 介绍 关系 完备 的 SQL 诸 言 所 不 上 其 备 的 一 些 特 性 ， 而 由 有 迹 
象 表明 非 过 程 性 的 上 万 法 事实 上 前 弱 了 该 语言 现 有 的 能 力 。 

1. 非 过 程 性 的 Select 语 向 

让 我 们 从 验证 两 种 语言 的 相对 非 过 程 件 开 始 ， 

例 3.11.1 ”回顾 例 2.7.8 推 导出 的 关系 代数 查询 ， 它 能 检索 出 所 有 订购 了 价格 为 $0.590 的 产 
品 的 顾客 的 名 字 : 


(LDRDER < {PRODUCTS where price = 0.50)[pid]} bi CUSTOMERS}[cname] 国 


这 种 方法 只 用 一 个 语句 就 完成 了 查询 ， 因 而 比 使 用 赋值 语句 ( : =) 米 保存 中 间 站 果 的 方法 
似乎 更 具 非 过 程 性 。 然 而 ， 这 一 优点 在 某 种 程度 上 是 一 种 错觉 。 该 表达 式 在 一 个 很 重 划 的 方面 
体现 出 了 过 程 性 ， 因 为 我 们 必须 首先 计算 括号 中 的 子 表达 式 ， 甚 至 在 没 加 括号 的 子 表达 式 中 ， 
图 2-§ 的 人 忧 先 权 规 则 也 有 限定 了 计算 的 先后 次 序 。 而 且 ， 用 户 显然 也 希望 按 这 种 顺序 来 计算 。 比 
如 ，({ PRODUCTS where price = 0.50) 在 [pia] 上 的 投影 运算 必须 先 于 它 与 
cCUSTOMERS 表 的 连接 运算 ， 央 为 我 们 并 不 要 求 疯 者 在 city 列 上 的 值 也 必须 相等 。 

关系 代数 中 有 许多 等 价 性 规则 ， 比 如 交换 律 和 结合 律 ， 这 些 规则 允许 我 们 将 一 个 表达 式 
转化 成 另 一 种 等 价 形 式 。 因 紫 ， 一 个 特定 的 严格 加 括号 的 关系 代数 查询 不 会 炉 碍 查询 优化 冀 
找 出 一 种 效率 更 高 的 变 体 形式 。 然 而， 毫 无 疑问 , 例 3.11.1 中 的 表达 式 隐 含 痢 精 确 的 计算 顺序 ， 
而 且 查 询 优 化 器 将 发 现 : 只 要 查询 是 用 加 括号 的 形式 来 表达 的 ， 那 从 更 高 的 层次 上 来 考虑 如 
何 高 效 地 实现 查询 目标 将 是 一 件 很 困难 的 事 。 含 有 髓 套 括 导 的 表达 式 与 一 个 使 用 赋值 语句 来 
建立 中 间 铺 果 的 语句 序列 几乎 没有 作 何 差别 。 换 句 话 说， 关系 代数 的 过 程 性 相当 强 。 想 一 想 
该 表达 式 与 等 价 的 SQL 语句 之 间 有 什么 差别 。 
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例 3.11.2 下面 用 SQL 话 铝 来 解决 同一 问题 一 检索 订购 了 价格 为 4.50 的 产品 的 顾客 
的 名 字 : 


select cname from customers tet, orders XxX, products p 
Where c.cid = x.cid and x.pid = ppid and p.price = 0.50; 面 


回顾 图 3-1$ 中 给 出 的 求解 Select 语 亿 的 概念 性 步骤 【在 3.9 节 的 开头 部 分 )}， 我 们 可 以 认为 
此 例 中 的 Select 语 名 是 按照 下 列 步 又 来 执行 的 ; 步 又 1 生成 FROM 子 名 中 的 customers，、 
orders 和 products 表 的 关系 弱 积 ， 然后 ， 步 又 2 删除 不 满足 WHERE 子 句 搜索 条 件 的 行 ; 最 
后 ,求解 选择 列表 中 的 表达 式 【 单 个 的 cname 值 ) 并 输出 结果 。 

当然 ， 这 种 概念 性 步骤 仪 仪 是 想象 计算 过 程 的 一 种 方法 。 并 不 一 定 是 数据 库 查询 优化 器 
实际 决定 采用 的 执行 方法 。 特 别 地 ， 查 询 优 化 器 可 以 随意 台 并 概念 性 步骤 中 的 连续 两 个 或 多 
个 步 又 比如， 如 前 所 述 ， 计算 机 的 访问 策略 可 能 不 会 一 开始 就 为 FROM 子 蚀 中 的 二 个 表 的 
乘积 创建 一 张 新 表 。 相 反 ， 该 访问 策略 可 能 会 通过 协 行 -- 个 二 重 循环 来 读 取 分 别 来 白 三 张 表 
的 二 个 独 由 的 行 并 对 每 个 新 的 三 行 组 全 测试 WHERE 谓 词 。 这样 , 我 们 就 把 步 蝶 1 和 2 合并 起 来 ， 
执行 创建 关系 乘积 的 循环 ; 在 存储 一 行 以 前 先 对 该 行 出 试 WwHERE 子 名 搜索 条 件 的 真 假 性 以 除 
去 不 满足 条 件 的 行 。 当 然 ， 查询 优化 器 也 可 能 采用 一 种 完全 不 同 的 党 略 来 合并 步骤 1 和 2: 一 
个 一 个 地 访问 oraers 表 中 的 所 有 行 ; 利用 cia 和 pida 值 的 唯一 性 ， 根 据 连 接 条 件 的 要 求 在 某 
种 高 效 的 索引 结构 中 “省 找 ” customers 表 中 在 cia 值 上 唯一 与 之 匹配 的 行 以 及 Products 
天 中 在 pid 值 上 叭 一 与 之 匹配 的 行 。 

上 面 全 部 论述 的 关键 在 于 在 瑟 一 个 SQL 语 名 的 时 候 ， 我 们 并 没有 对 精确 的 计算 顺序 作出 
任何 假定 ! -一 个 Select 语 句 促 仅 是 对 要 检索 什么 数据 的 种 说 明 ， 和 击 不 是 描述 如 何 检索 数据 的 
一 个 过 程 。 图 3-15 所 提供 的 概念 性 计算 步骤 仅仅 是 -一 种 用 户 可 以 想象 的 而 有 总 能 奏效 的 步 取 ; 
对 FROM 子 句 中 的 表 做 乘积 先 于 删除 不 满足 wHERE 子 句 搜 索 条 件 的 行 是 因为 搜索 条 件 在 乘积 
以 前 一 般 是 没有 意义 的 【参见 例 3.11.2 中 的 谓 间 ) ; 根据 搜索 条 件 来 删除 不 符合 条 件 的 行 必 须 
发 生 在 计算 选择 列表 的 结果 之 前 。 查 询 优化 过 程 中 的 一 项 重要 技术 是 : 以 一 种 不 同 于 概念 性 
步 又 的 方法 来 计算 Select 语 句 。 在 提高 效率 而 不 改变 结 时 的 前 提 下 ,合并 其 至 裔 倒 某 些 步 又， 
比如 ， 在 上 述 三 重 循环 的 方法 中 ， 如 果 对 行 的 删除 以 连续 行 的 形式 进行 ,那么 乘积 的 全 部 结 
果 就 会 推 后 ， 所 以 这 两 步 已 被 台 并 了 起 来 。 与 这 种 方法 相 联系 的 一 个 重要 想法 是 : 一 已 产生 
的 行 多 得 是 以 满 是 当前 的 需求 ， 三 重 御 环 的 过 程 能 够 和 暂停。 比如， 屏幕 在 显示 了 一 整 屏 的 输 
出 行 之 后 就 暂停 显示 ， 要 使 后 面 的 输出 行 继续 显示 出 洲 ， 用 户 必 须 提 出 请 求 。 这 一 过 程 体现 
了 三 个 步骤 的 合并 ， 而 且 如 果 用 户 决 定 在 输出 别 的 结果 以 前 就 终止 星人， 那 还 能 市 省 大 量 的 
空间 。 在 使 用 索引 的 方法 中 ， 我 们 根据 oraers 表 中 的 ciq 值 来 查找 custcmers 表 中 的 一 行 ， 
这 就 俩 得 史 HERE 子 铝 的 删除 操作 先 于 FROM 子 句 的 滋 积 拘 作 而 且 消 除了 访问 custcmers 表 
中 每 一 行 的 需要 。 

我 们 刚才 看 到 了 非 过 程 性 的 Select 庄 句 的 一 项 重要 优点 。 当 提供 了 要 检索 什么 数据 的 一 种 
说 明 而 不 是 描述 如 和 何 操作 的 一 个 过 程 时 ， 我 们 把 决定 具体 访问 策略 的 任务 留 给 数据 库 系 统 。 
在 理论 上 ,数据库 查 询 优 化 茵 完全 有 能 力作 出 究竟 如 何 进行 数据 导航 以 检索 所 需 的 信息 这 业 
复杂 的 其 定 。 该 决定 通常 能 优 于 程序 员 所 能 作出 的 雇 定 ， 这 是 因为 程序 员 在 甘 个 特定 几时 刻 
写 了 一 个 查询 之 后 便 不 再 关注 它 ( 程 夺 员 的 时 间 是 相当 宝 泪 的 )， 所 以 由 程序 员 扎 决定 有 的 访问 
策略 不 可 能 随时 跟踪 表 在 大 小 和 索引 等 方面 的 最 新 发 展 。 另 一 方面 ， 如 条 查询 优化 天 能 注意 
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到 某 些 条 件 上 的 明显 变化 ， 一 个 未 经 收 改 的 Select 语 句 以 后 还 可 以 被 重新 编 详 并 且 能 生成 一 个 
不 同 的 访问 策略 。 我 们 将 和 在 后 面 有 关 索 引 和 性 能 的 章节 中 讨论 更 多 关于 查询 优化 的 问题 。 

2, 图 吴 能 为 

学 过 “自动 机 理论 ” 用 在 正规 的 语言 中 } 的 读者 可 能 遇 到 过 图 灵 论 题 【Turing's thesis ) 
这 一 概念 。 数 学 家 图 灵 研 究 了 一 种 概念 性 的 机 咒 ， 除 了 能 用 无 限 的 磁带 (或 内 存 ) 来 保存 中 
间 缩 果 以 处 ， 在 曾 的 特性 上 它 与 现代 计算 机 很 相似 。 图 灵 使 几乎 每 个 人 都 相信 这 种 能 执行 有 
限 长 度 的 简单 过 程 性 程序 的 机 器 具有 执行 任何 可 用 特定 (算法 的 ) 术语 来 描述 的 计算 过 程 所 
必需 的 所 有 能 力 。 所 以 ， 留 灵机 能 计算 出 下 一 盘 完 美的 国际 象棋 的 全 部 志 法 【可 能 会 花 很 长 
的 时 间 ) 或 者 能 在 它 访问 过 的 数据 上 创建 任何 类 型 的 报表 ， 只 要 需要 该 报表 的 人 能 在 有 限 的 
步骤 里 准确 地 描绘 出 创建 该 报表 的 方法 即 可 。 用 特定 的 僵 记 来 实现 这 类 计算 的 能 力 被 称 司 计 
算 的 完备 性 (computational completeness )， 或 者 有 时 也 被 称 做 图 灵 能 力 【Turing power )。 如 
果 我 们 假定 所 有 诸如 C 之 类 的 现代 编程 语言 都 能 使 用 任意 大 {无限 ) 的 寻 址 空间 来 存储 中 间 结 
末 ， 那 它们 都 具有 图 灵 人 能力。 因此 ， 图 如 能 力 是 测试 语言 能 力 的 茜 准 ， 

没有 一 种 非 这 程 性 二 言 可 能 具备 图 灵 能 力 。 设 想 一 下 在 菜单 上 选择 选项 的 模型 ， 由 于 可 
选择 的 选项 是 全 部 选项 的 任意 子 集 ， 所 以 我 们 的 选择 最 终 只 能 局 限于 数量 有 限 的 几 种 可 能 组 
侣 中。 有些 选项 还 可 能 提供 参数 以 扩大 我 们 的 选择 范围 4 比如 在 ORDER BY 了 于 句 中 指 息 你 名 小 
但 是 除非 该 模型 允许 将 任意 长 的 顺序 程序 编 人 参数 【这 将 背离 我 们 的 号 标 1， 否 则 ， 它 不 可 能 
产生 图 灵 能 万 。 

缺乏 图 灵 能 力 并 不 一 定 是 一 个 乡 大 的 缺点 。 比 如 ， 人 类 的 大 脑 并 不 捧 的 具有 贸 双 能 力 ， 
因为 它 可 能 上 只 有 有 限 的 储存 中 间 结 果 的 能 力 , 但 是 ， 图 灵 能 力 是 考虑 SQL 于 查询 数据 库 时 能 
做 什么 以 及 当 使 用 能 访问 同样 数据 的 编程 语言 (比如 CC) 时 我 们 能 做 什么 的 出 发 尽 。 御 介绍 扳 入 
式 SQL 的 第 4 章 里 ， 在 学 习 如 何在 一 个 程序 中 调用 SQL 的 时 候 ， 我 们 会 发 现 我 们 能 写 出 具有 这 
种 特性 的 程序 ， 而 这 是 使 用 非 过 程 性 的 SQL 所 无 法 实现 的 。 如 今 ， 似 平 只 有 极 个 测 的 数据 
库 专业 人 员 会 对 此 持 有 异议 。 关 系 模 型 的 早期 拥护 者 们 以 此 为 据 认 为 应 该 使 非 程 大 员 获 得 通 
过 交互 式 界 而 完成 一 切 操 作 的 能 力 。 此 建议 看 似 合 理 ， 实 践 起 来 却 困难 重重 一 现在， 几乎 
所 有 的 数据 访问 都 还 是 通过 数据 库 应 用 程序 来 实现 的 。 目 前 的 公认 看 法 是 : SQL 语句 的 价值 
在 于 它 的 灵活 性 和 通用 性 ， 而 这 种 灵活 性 和 通用 性 的 受益 者 与 其 说 是 终端 用 户 还 不 如 说 是 程 
序 员 ，。 

3. 基本 SQL Select 语 名 的 有 限 能 力 

下 面 ， 我 们 通过 列举 一 些 基 本 SQL 所 不 能 实现 的 查询 例子 来 研究 本 章 所 介绍 的 基本 SQL 
Select 语 句 的 局 限 性 。 这 些 例子 之 所 以 有 价值 是 峙 为 它们 大 都 推动 了 新 的 对 象 - 关 系 SQL ( 奏 
第 4 章 介 绍 ) 的 发 展 。( 同样 ， 为 了 实现 其 中 的 一 些 查询 ，3.6 节 的 一 些 高 级 SQL 语法 也 对 基本 
SQL 的 功能 进行 了 扩展 ) 

(1) SQL 和 非 过 程 性 集合 基数 

我 们 曾经 说 明了 关系 代数 共有 一 阶 谓词 逻辑 的 全 部 能 力 。 可 能 当 我 们 意识 到 没有 一 个 
SQL 集 合 函 数 属于 关系 代数 时 ， 这 一 点 似乎 就 没有 那么 可 怕 了 。( 关系 代数 原本 可 以 引 人 这 些 
集合 函数 ， 但 最 终 还 是 没有 。) 所 以 ， 在 关系 代数 中 我 们 无 法 回答 这 样 的 问题 金额 超过 $500 
的 订货 记录 有 多 少 个 ?我 们 已 为 SQL 增 加 了 集合 函数 : sum、avg、max、min 和 count。 还 能 想 
起 别 的 来 吗 ? 
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例 3.11.3 ”中 值 (median ) 是 一 种 统计 平均 值 ， 对 某 些 统计 数据 《比如 每 月 的 房价 ) 而 言 ， 
它 通 常 是 一 种 比 SQL 集 全 函数 avgf ] 所 提供 的 均值 更 为 稳定 的 度量 。 给 定 一 个 n 个 数 的 序列 ，a, ， 
ca 有 对 = 1 下 -1，e 反 4+，medan 种 定 文成 序列 中 的 a 值 ， 其 中 大 = 
FLOCOR(n+1y2n。 由 于 median 不 属于 SQL 的 集 和 台 上 晤 数 ， 所 以 我 们 不 能 写 出 下 面 这 种 Select 否 何 : 


select mediantdollarsy from orders: -- *% INYALID SOL SYNTAX 


为 了 说 明 median 郴 数 的 运算 过 程 ， 我 们 将 图 2-2 中 orgders 表 的 所 有 行 的 dcl1lars 值 排 成 
一 个 非 递 减 的 序列 ， 从 而 得 到 { 130.00, 450.00. 450.00, 450.00, 450.00, 500.00, 540.00, 540.00， 
600.00, 704.00，720.00,，720.00，800.00,，880.00，1104.00, 1104.00}。 这 里 共有 16 个 数据 项 ， 所 
以 median 值 就 是 编号 为 FLOORI((1L6 + 172) 的 数据 项 ， 即 第 8 项 ， 也 就 是 540.00。 

事实 上， 我 们 可 以 巧妙 地 运用 允许 子 查询 结果 作为 FROM 和 表 的 高 级 SQL 扩展 语法 来 计算 中 
值 。 参 多 习题 3.18。 国 

其 他 常用 的 集合 晴 数 有 mode 和 variance. 一 个 数 集 的 模 ( mode ) 是 在 硫 集 合 中 最 常 出 现 
的 数 ， 而 方差 ( variance ) 则 是 一 种 重要 的 统计 度量 ， 即 单个 检察 值 与 均 供 《集合 畴 数 avgt ) 
的 结果 ) 差 的 平方 均值 。 事 实 卡 ，ORACLE 产 品 确实 提供 了 集合 函数 variance{ )。 统 计 学 家 
们 通常 将 观察 值 的 平方 和 视 为 二 阶 矩 【second moment )。 我 们 也 可 以 用 一 阶 定 以 及 被 称 慌 一 
阶 矩 〈 first moment ) 的 均值 来 表示 方差 。 但 是 ， 实 际 应 用 对 集合 函数 的 需求 是 无 止境 的 ， 因 
为 三 阶 矩 【三 次 方 的 均 伪 )、 四 阶 筷 【由 次 方 的 的 值 ) 以 及 更 高 的 阶 矩 都 在 实际 应 用 中 有 一 
定 的 用 武之 地 值得 注意 的 是 ， 所 有 这 些 集合 冰 数 都 很 容易 用 能 访问 数据 的 程序 来 实现 ， 只 
需 用 一 个 循环 来 读 取 所 有 的 值 并 执行 适当 的 聚集 操作 ， 比 如 平方 和 等 。 然 而 ， 在 非 过 程 性 的 
SQL 模 型 中 ， 如 果 系 统 没有 提供 某 个 集合 函数 ， 那 么 我 们 就 不 能 求 得 该 明 数 的 结果 。 因 此 ， 
提供 一 种 被 称 做 用 户 定义 函数 的 工具 使 用 户 能 在 SQL 中 创建 新 的 集合 郴 数 这 --- 想 法 就 成 为 推 
动 第 4 章 要 介绍 的 对 象 -关系 SQL 发 展 的 动因 之 一 。 妆 然 ， 该 竺 性 在 日 前 的 大 多 数 产 品 中 还 未 
得 到 实现 。 

我 们 的 基本 SQL 所 不 具备 的 另 一 项 特性 是 集合 盟 数 的 能 套 。 不 过 ， 我 们 在 例 3,8.5 中 已 
指出 该 特性 是 3.6 节 图 3-11 所 列 的 扩展 语法 的 一 部 分 并 且 已 在 QRACLE 和 DB2 UDB 中 得 到 了 
实现 。 

例 3.11.4 ”构造 一 个 查询 以 求 出 所 有 代理 商 每 人 销售 总 额 的 平均 值 。 一 种 看 似 自 然 的 方法 
( 即 集合 薄 数 的 散 套 ) 如 下 所 未: 

splert avotselect sumidollars) from orders -- ** THYALID SOL SYNTAX 

group by aid}: 

不 幸 的 旺 ， 此 SQL 语句 是 无 效 的 ， 因 为 SQL 不 允许 子 查询 出 现在 一 个 集合 男 数 的 内 部 。 
如 果 数 据 库 系统 支持 将 某 个 查询 的 结果 用 作 可 供 检索 的 表 的 这 种 高 级 SQL 特 性 ， 孝 么 我 们 可 
用 下 面 的 语句 来 实现 此 查 何 ; 


select avoyttotdoliars) from 
{select sumtdollarsy as totdollars from orders -- ** ADVYANCED SOL SYNTAX 


group by aid;) sumtab; 


把 上 述 语句 中 的 子 查 询 作 用 到 图 2-2 的 orders 表 上 ， 它 产生 烛 下 表 : 
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这 些 值 的 平均 值 为 1633.67。 

在 基本 SQL 中 ,确实 有 一 种 方法 能 求 出 所 有 代理 商 每 人 总 销售 额 的 平均 值 。 由 于 此 平 鬼 
值 等 于 代理 商 每 人 总 销售 额 之 和 除 以 代理 商 的 数 上 日， 并 且 由 于 代理 商 等 人 总 销售 额 之 和 就 是 
全 部 销售 额 之 和 ， 所 以 我 们 可 用 下 面 的 语句 来 实现 此 查询 

select symtdollars)/counttdistinct aid) from orders:; 
然而 ， 基 本 SQL 不 允许 集合 范 数 秀 套 这 一 事实 依旧 存在 。 正 内 为 这 样 ， 我 们 可 以 列举 出 大 量 
无 法 由 任何 基本 SQL Select 语 名 实现 的 请 求 。 比 如 ， SQL 元 法 求 出 代理 商人 每 人 平均 销售 额 的 
总 各 或 是 代理 府中 每 上 人 总 销售 额 的 最 大 值 。 我 们 将 在 下 一 章 持 看 到 如 何 用 以 过 程 性 方式 访问 
SQL 数 据 的 程序 来 实现 这 类 查询 。 

{2) 非 过 程 性 报表 

关系 代数 所 不 具备 的 另 一 个 概念 一 -GROUP BY 子 句 ， 为 SQL 提供 了 创建 报表 的 幼 能 。 但 
我 们 可 以 轻而易举 地 找 出 基本 SQL 所 不 能 创建 的 报表 。 正 如 求 中 值 的 例子 ， 高 级 SQL 扩 展 语 
法 确实 提供 了 构造 下 例 中 的 查询 所 需 的 能 力 。 

例 3.11.5 “” 按 下 列 杰 求 创 建 一 个 报表 : 将 全 部 的 销售 额 根 据 金额 大 小 分 类 。 类 别 【我 们 称 
之 为 范围 ) 划分 如 下 ，0.0-499.99,500.00-999.99， 依 此 类 推 。 我 们 可 能 会 与 出 如 下 所 示 的 语句 


select range-start, sumidoTlars) from orders -INVUALIO SOL SYNTAX 
group by dollars fn ranges from 0.00 in blocks of 500.00; 


创建 这 样 的 报表 是 为 了 体现 每 个 销售 额 类 别 对 总 销售 额 的 页 献 。 销 售 经 理 可 能 希望 以 这 
种 方式 来 确定 哪 一 范围 内 的 销售 额 最 能 体现 基本 的 销 仿 额 水 平 。 对 图 2-2 中 的 orders 表 来 说 ， 
该 查询 的 结果 为 ， 


Kr 


以 范围 0.00 ~ 499.99 为 例 ， 落 在 此 范围 内 的 4ol11lars 值 为 450.00, 450.00,，180.00, 450.00， 
460.00 和 400.00， 合 计 2390.00。 像 这 样 的 报表 不 可 能 由 一 个 合法 的 基本 SQL 语 铝 产生。 我 们 
可 以 用 两 种 高 级 SQL 功 能 来 实现 此 查询 : CAST 表 达 臣 以 及 FROM 子 句 包含 子 查询 的 能 力 。 人 参 
见习 题 3.18 和 习题 3.19。 哺 


显然 ， 这 类 报表 可 以 由 过 程 性 的 编程 语言 产生 。 事 实 上 ， 我 们 可 以 想象 出 泥 数 个 无 法 几 
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SQL 非 过 程 性 地 剂 建 代 可 以 用 程序 来 产生 的 报表 形式 ， 除 了 编 瑟 可 访问 数据 库 的 过 程 性 程序 
以 外 似乎 就 没有 别 的 方法 可 以 解决 这 类 问题 了 .我 们 将 在 第 5 章 里 介绍 其 体 的 操作 方法 : 

(3) 传递 闭 包 

一 阶 滑 词 演算 的 一 个 显著 缺点 是 它 不 能 实 现 传递 闭 包 (transitive closure)， 考 谍 定 多 在 节 损 
集合 {a, b. c, … } 上 的 有 向 图 G; 当 有 一 条 从 a 指 向 b 的 迪 时 ， 我 们 称 a 一 pb 该 图 是 传递 的 当 且 
仅 当 下 面 的 性 质 成 立 : 对 任何 a 一 b 且 b 一 c， 边 a 一 c 也 存在。 对 于 -个 非 传 递 的 图 G， 我 们 可 
以 添加 边 使 得 传递 性 对 所 有 的 节点 三 元 组 (a,b,c) 都 成 立 : 若 a 一 bHb 一 ce， 则 添加 边 a 一 <( 如 
果 它 还 不 存在 )， 在 做 完 这 些 以 后 ， 我 们 基本 上 可 以 说 从 a 到 c 的 任意 条 路 径 中 必 有 - -第 是 从 a 
到 ec 的 边 。 这 种 添加 边 的 过 程 所 产生 的 结果 被 称 做 图 怠 的 传递 团 包 。 这 种 想法 有 时 会 体现 在 真 
实 的 查询 中 。 


例 3.11.6 让 我 们 用 下 面 的 Create Table 语 句 来 创建 一 个 名 为 employees 的 表 : 


Create table employees teid chartsy net null, ename varchartl6y)., 
marid charts}}: 


篇 性 e ia 代表 员工 号 ， 它 是 每 行 所 代表 的 员工 的 唯 -标识 ， 而 属性 mg cid 则 代 骨 该 员工 . 
的 硕 头 上 可 的 员工 三 。 假 定 我 们 已 经 导 信 employees 表 : 
已 用 及 1 咎 让 三 
ee | enane ,morie | 
| rca | 
ELIET EE 


这 里 要 注意 员 e010, Chumley 是 e007, Suzanne (经理 ) 的 直接 下 属 ，Suzanne 是 e003， 
Jose 的 直接 下 属 ， 而 Jose 则 是 e001, Jacqueline 的 直接 下 属 。Jacqueline 的 mgriadq 列 上 是 一 个 对 
值 因 为 她 是 总 裁 ， 没 有 土司 。 我 们 可 以 很 轻松 地 写 一 个 Select 各 名 来 列 出 性-- 特 定员 工 〈《 盆 设 
是 -个 经 理 ， 理 则 结果 列表 为 空 ) 的 所 有 直接 下 属 。 比 如 ， 为 了 检索 Jacqueline ( 员工 号 为 
e001 ) 的 所 有 直接 下 属 ， 我 们 键入 以 下 Selecti 语 促 ; 

select e.eid from Employees e where e.mgrid = e001: 

该 语句 将 列 出 员工 e002, e003 和 e004。 现 在 ,我们 也 可 以 检索 这 些 员 上 的 所 有 直接 下 属 : 
select Ee.eid from smplovees e Where e.mgrid in 
(select f.eid from employees f where f.mgrid = e001}:; 

同 前 面 一 样 ， 该 语句 将 列 出 满足 下 列 条 件 的 所 有 员工 : 该 员工 是 于 查询 所 返回 的 茶 个 员 
工 的 直接 下 属 。 内 此 ， 我 们 将 得 到 e005, e006, e007, e008 和 e009。 员 工 e010 不 在 其 中 是 因为 她 
是 e007 的 直接 下 属 面 不 是 子 查询 所 返回 的 任 一 员工 的 直接 下 属 。 单 个 SQL 表达 式 都 不 能 保证 
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完整 地 列 出 e001 手下 所 有 不 同 级 别 上 的 员工 (其 至 3.6 节 的 高 级 SQL 也 不 能 保证 )。 这样 的 查询 
应 返回 除 e001 以 外 的 所 有 员工 。 国 

如 果 把 employees 表 表示 成 一 张 贸 : 每 一 行 对 应 一 个 节点 以 及 一 条 从 mgrigd 指 向 eid 的 
边 ， 那 么 在 上 便 中 我 们 可 以 用 一 个 Select 语 句 烈 出 从 任 一 特定 eiqd (比如 e001) 经 过 一 条 边 
所 能 到 达 的 所 有 员工 ; 同样 ， 我 们 可 雇 检 索 出 从 尾 一 特定 eia 经 过 怡 好 两 条 边 岳 能 到 达 的 所 
有 员工 。 我 们 正 试图 构造 的 查询 将 返回 从 一 个 特定 sia 经 过 任意 条 按 所 能 到 达 的 所 有 员工 。 
如 果 该 图 具有 传递 闭 包 的 性 质 ， 那 么 所 有 有 路 径 可 达 的 员工 也 必定 可 以 由 一 条 边 被 到 达 。 在 
查询 语言 中 构造 这 样 一 个 查询 的 能 力 通 常 被 称 做 传递 闭 包 。 

ORACLE 产 品 已 提供 了 商 个 可 网 造 传 递 闭 包 查 询 的 非 标 准 Select 子 一 一 CONNECT BY 
和 START WITH。 检 索 以 e001 为 上 司 的 全 体 员 工 这 一 查询 在 ORACLE 中 有 具有 如 下 形式 : 


select eTd from employeres 





coniect by prior eid = mgrid 
start with eid = ‘edQ0Q1': 


SQL-99 也 包含 了 支持 传递 查询 的 功能 ， 本 书 对 此 不 作 介绍 。 

(4) 布尔 条 件 的 有 限 能 力 

在 信息 检索 的 某 些 领域 里 存在 着 一 个 车 遍 共识 : SQL 语言 存在 着 严重 的 缺陷 是 眼 为 用 户 
在 构造 查询 时 受到 了 布尔 条 件 的 限制 。Gerard Salton 一 一 文本 检索 领域 里 的 创始 人 之 一 列举 了 
大 量 的 例子 以 说 明 布 尔 条 件 不 能 提供 解决 某 些 重大 问题 所 需 的 能 力 。( 参见 [6], 《4 Extended 
Bovtlean Retrieval Model, Fuzzy Set Extentions? ,10.4 季 ,) 

例 3.11.7 假定 有 一 个 名 为 aocuments 的 表 , 每 一 行 代表 一 个 文本 文档 《比如 期 刊 文章 )， 
主键 为 aocid， 每 个 文档 都 用 一 百 个 关键 词 (keywordq 值 ) 来 慰 识 文章 的 主题 【比如 ， 
mapnetic Tesonance，Superconductor galiium arsenide )。 正 如 我 们 在 2.3 节 对 第 一 范式 的 说 明 中 
所 见 到 的 ， 要 实现 这 种 联系 还 需要 一 张 包含 两 个 属性 keyword 和 和 docid 的 keywords 表 。 
图 3-25 给 出 了 一 个 满足 上 述 条 件 的 简单 例子 。 

如 图 3-25 所 示 ， 关 键 词 'integer' 和 'integral' 出 现在 'Intro Math' 文 档 中 ， 关 键 词 'SQL' 出 现在 
Intro DB' 文 档 中 ， 而 关键 词 felation' 则 同时 出 现在 这 两 个 文档 中 。 我 们 通常 会 有 几 十 万 个 文档 
和 几 千 个 关键 词 ， 而 且 在 这 些 文件 中 存在 着 大 量 的 关键 词 重用 现象 。 为 了 检索 文档 d12293 的 
所 有 关键 词 ， 我 们 会 用 如 下 查询 : 

select k,keyworgd from keywords k Where k.docid = “LE2293 
为 了 检索 拥有 关键 词 Xyzl' 的 所 有 文档 ， 我 们 会 用 如 下 查询 : 


select from documents dd where 中 ,CS jn 
(select k.doctd from keywords k where k.keyword 一 “员外 


检索 文件 的 一 种 常用 方法 是 找 出 一 串 与 我 们 想 要 的 内 容 相 关 的 关键 词 。 检索 包 合 特定 集 
合 {XYyzl, XYyz2.… ，XYyz6} 中 的 全 部 六 个 关键 词 的 所 有 文件 这 一 查询 可 用 3.5 节 所 介绍 的 FOR 
ALL 查 询 类 型 来 表达 ， 形 式 如 下 : 


select * from documents d -- Fetrieve documents dd 
where not exists 
(select * from Kevywords k -- ,。， Whenra no keyword 


where k.keyword in ,in our 1ist 
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Cyzl', MyZe' ,Kyzd", 
RZ RED ,RE 
and Not exists 


(select * from Keywords m -- ... fails to equal 
where mkeywoerd = kK. keyword -- a keyword 
and 向 ,人 GCT = d.docid}) i); -- in the document dd 


documents keywords 


[we re | 


d12272 | Intro Math - integer | d12272 


一 
| 





图 3-25 苹 档 和 关键 下 数据 库 


总 之 ， 我 们 选 出 任何 满足 下 列 条 件 的 文档 9: 不 存在 这 样 -一 个 关键 词 ， 它 在 我 们 的 关键 词 
列表 中 ， 但 又 不 是 文 梢 4 的 基 键 词 。 对 这 样 一 个 简单 的 思想 来 说 ， 这 是 一 个 相对 复 隶 《 而 且 效 
率 低下 /的 查询 ， 但 这 还 不 是 最 糟 糙 的 傅 况 。 更 重要 的 是 ， 如 果 届 有 一 个 文档 包 人 沼 了 全 部 六 
个 关键 间 ， 那 情况 会 是 扯 样 的 呢 ? 我 们 香料 才能 构造 一 个 查询 来 检索 合 有 其 中 任意 五 个 关键 
癌 的 文档 ” 或 者 任意 四 个 ? 在 SQL 中 没有 这 样 的 场 法 。 实 际 上 ， 检 索 售 有 其 中 任意 五 个 关键 词 
的 所 有 文档 需要 六 个 查询 语句， 而 检索 含有 其 中 任意 四 个 关键 词 的 所 有 文档 则 需要 (6 x 5)/2 = 
15 个 查询 语句 。 加 

这 里 应 注意 的 是 ， 检 索 企 一 系列 属性 上 符合 用 户 期 望 的 所 有 行 这 类 请 求 对 应 一 个 模糊 集 
合 【fuzzy set ) 概念 ， 这 只 是 文档 检索 领域 里 的 一 项 基础 工作 而 已 。 不 问 的 关键 词 经 常 根据 其 
重要 性 而 带 荆 不 同 的 权 值 ， 查 询 条 件 可 能 也 会 被 加 权 ， 而 不 同 的 K 维 距离 测量 方法 则 被 用 来 检 
索 匹 配 竹 度 最 高 的 一 组 文档 。 用 户 有 忆 请 求 特定 数 基 的 文档 并 且 要 求 返 回 的 文档 按照 匹配 程 
度 从 高 到 低 的 顺序 排列 。 此 外 ， 有 人 提议 并 初步 开发 了 为 用 户 带 来 极 大 方便 的 界面 ， 它 替 用 
户 提 交 查 询 并 让 用 户 对 已 返回 的 文 梢 与 他 们 期 望 之 间 的 接近 程度 做 出 评 份 ， 系 统 对 用 户 的 评 
价 进 行 统计 分 析 从 而 形成 一 定 的 反馈 信息 并 根据 它 来 修改 查 测 中 的 权 值 。 布 尔 型 的 搜索 条 件 
由 于 其 自身 的 局 限 性 因而 不 能 表现 出 上 述 的 大 多 数 特性 。 我 们 仅 在 熟悉 的 CAP 数 据 库 环 境 下 
考察 其 中 的 一 个 特性 : 检索 特定 数量 的 文档 并 让 它们 按照 匹配 程度 的 降 厚 排列 。 


例 3.11.8 ”在 标准 的 CAP 数 据 库 中 ， 假 定 代 理 商 的 数目 非常 庞 太 ， 而 我 们 想 打印 出 总 销 
售 额 排名 前 20 位 的 代理 商 和 名单 以 便 奖 励 他 们 去 夏威夷 度假 。 这 一 请 求 无 法 用 SQL 一 句 来 实现 。 
当然 ， 按 照 总 销售 额 从 高 到 低 的 顺序 来 列 出 所 有 的 代理 商 还 是 可 能 的 。 


select aid,. sumtdol lars}y from orders x group by aid 
order by 2 dest; 


对 于 该 查询 的 输出 结果 ,我 们 可 以 在 得 到 最 初 的 20 行 之 后 便 停 止 检索 ， 这 样 就 可 以 把 结 
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果 限 制 在 我 们 所 关心 的 代理 商 中 。 当 然 ， 这 暗 水 着 一 个 过 程 的 执行 。 加 
第 5 章 将 介绍 如 何 创 建 程序 来 解决 本 节 所 引信 的 任何 了 问题， 当然， 这 里 指 的 是 我 们 能 想 记 
算法 的 那些 问题 。 尽管 如 此 ， 例 3.11.7 的 模糊 集合 问题 仍然 颇 上 其 挑战 性 ， 因 为 关系 模型 实在 个 
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Jim Melton ( 编订 了 SQL-92 标 准 ) 和 Alan R. Simon 的 文章 [4] 介 绍 了 SQL-92 标 准 。 对 
XADOpen 标 准 的 介绍 在 [由 中 。 对 DB2 UDB SQL 的 介绍 在 推荐 读物 [11 和 推荐 读物 [2] 中 。 对 
INFORMIX SQL 的 介绍 在 推荐 读物 [3} 中 。 对 ORACLE 8 SQL 的 介绍 在 [5 中。 有 关 文 本 检索 的 
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习题 

在 本 书后 面 “ 习 题解 答 ” 中 有 管 案 的 习题 都 用 符号 来 标记 。 

学 生 作 业 ; 我 们 建议 学 生 们 用 如 下 方式 来 提交 可 执行 的 SQL 语 名 在 适当 的 目录 下 创建 
SQL 命 令 文 件 ， 文 件 的 名字 从 Q1A 到 9Q1U， 依 此 类 推 。 这些 命令 文件 应 包含 正确 的 (测试 过 
的 ) 查询 。 然 后 ， 在 脚本 模式 下 显示 并 运行 这 些 查 询 ， 该 模式 会 把 运行 的 结果 存 人 一 个 可 上 
交 的 文件 中 。 注 意 前 面 的 几 个 查询 将 返回 数量 庞大 的 结果 行 ， 在 那 种 情况 下 ， 在 上 交 结 果 文 
件 以 前 ， 请 删除 其 中 的 大 部 分 结果 行 。 

注意 “习题 3.1 至 3.7 仅 涉及 到 3.5 节 所 介绍 的 SQL 特征， 这 些 特 征 提供 了 第 2 章 的 关系 代 

数 所 具 各 的 能 力 。 

3.1 用 SQL 查询 来 回答 第 2 章 结尾 部 分 的 习题 2.5 (a) 到 避 ) 的 请 求 。 
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3.2 在 下 面 的 (和 (b) 中 使 用 Al 谓词 或 Any 谓 词 : 
{a)y* 人 惟 款 人 金 百分率 大 寺 最 小 必 金 百分率 的 代理 商 的 aiqd 值 ( 列 名 : percent )。 
(b} “检索 获得 了 最 商 侦 金 分 率 的 代理 商 的 aiqd 值 。 
(c)" 解释 为 什么 下 面 的 查询 无 法 回答 上 述 请 求 (a }， 尺 管 它 从 图 2-1 的 agents 表 中 
检索 到 的 结果 行 正好 是 (a) 的 正确 管 案 : select aid from agents 
where a.percent > 9: 
3.3 谓词 [IN 和 谢 词 =SOME 具 有 相 回 的 效果 (在 便 3.4.8 中 有 说 明 )。 
(a)* 假定 上 述 结论 成 立 ， 解 释 为 什么 谓词 NOT IN 和 <>ANY( 不 等 于 任何 一 个 ) 具 有 
不 同 的 效果 ， 相 反 ， 与 NOT IN 具有 相同 效果 的 是 <>ALL。 
tb) “运行 例 3.4.13 中 使 用 请 词 NOT IN 和 <>ALL 的 两 个 查询 。 然 后 把 <>ALL 换 成 
<>ANY， 运 行 赫 换 后 的 查询 并 用 语言 表述 检索 到 的 结果 是 什么 。 
(c)"。 运行 例 3.4.7 的 查询 ， 它 使 用 了 谓词 <=ALL。 要 恰好 检索 到 使 用 <=ALL 没 有 检 
索 到 的 行 ， 你 认为 应 该 用 哪个 量化 比较 谓词 来 替换 <>ALL? 通过 运行 来 证 明 
替换 后 的 查询 返回 了 正确 的 行 ， 
(由 参见 谓 间 <ANY 和 <AELL 的 定 尽 并 解释 为 什么 这 些 谓 词 与 子 查询 返回 单个 元 素 
情况 下 的 条 件 expr < ( Subquery ) 中 的 < 具有 相同 的 食 尽 。 
34 (a)* 写 出 一 个 不 含 子 查 光 的 SQL 语句 来 解决 例 3.4.1 的 同 题 。( FROM 子 句 应 引用 与 
该 查询 相关 的 所 有 表格 。) 
(b) ”我 们 总 能 像 (a) 那 样 浴 免 于 查询 吗 ? 假定 有 一 个 具有 属性 A,，…, A, 的 表 S 和 有 具有 
属性 B,,… , B, 的 表 T， 以 及 常数 c 和 k， 当 i = 1, 2, 3 时 ，A, 和 B, 来 自 同 一 个 域 ， 
c、k 与 A,( B;) 来 自由 一 个 域 。 考 虑 查询 


Sel ee Alre.s. An from $ where A = 长 and 
A] in (select B] from T where B» -= ce): 


事 写 此 Select 语 争 ， 权 求 得 到 相同 的 结果 但 不 要 用 子 查 调 。 不 要 埠 记 必要 时 应 对 属性 名 进 
行 限定 。 
(c)* 重复 (b)， 重 写 下 面 的 查询 ， 但 不 要 用 子 查询 。 


select A].-..., An from 3 where As = Kk and 
A in tselect B] from T where B» = © and Bs =- S.A4}: 


3.5 [ 玲 ] 求 出 满足 条 件 的 所 有 (cid，aiq) 对 : 其 中 的 网 客 ciq 没 有 通过 代理 商 aiaqTJ 货 . 
这 可 以 南下 面 的 Select 否 人 句 来 实现 : 


select cid, aid from customers CcC,. agents a 
where not exists {select * from Orders x 
where wtid = ctid and xX.aidt = a.81d).; | 


用 NOT IN 谓词 和 一 个 子 查询 联 用 的 形式 来 代替 NOT EXISTS 谓 词 形 式 可 以 实现 此 查询 
吗 ? 使 用 NOT IN 谓词 和 多 个 六 查询 联 用 的 形式 可 以 吗 ? 解释 你 的 答案 并 通过 运行 来 展示 所 有 
的 竺 价 形 式 。 
3.6 再 看 一 下 图 3-3 的 伪 码 。 
(a)* 每 出 相应 的 伪 码 说 明 在 不 用 艇 伍 循 坏 的 情况 下 如 何 求解 习题 3.4(Db) 的 查询 。 你 应 
该 有 两 个 独立 的 循环 (而 不 是 一 个 在 另 一 个 的 内 部 ) 一 一 第 一 个 循环 对 应 上 子 


118 禾 据 主 原 理 、 毅 程 与 性 能 


查询 ， 它 将 结果 (A, values) 放 人 值 列表 LL 中， 而 第 二 个 循环 则 用 一 个 谓词 来 测试 
值 A, 是 否 在 L 中 。 我 们 不 对 伪 码 的 形式 作出 严格 的 定义 ， 但 要 尽量 把 意思 表达 
清楚 【参照 图 3-3 的 伪 码 )。 


(tb) 解释 为 什么 在 用 伪 码 表示 习题 3.4(c) 的 查询 时 不 能 避免 说 套 循环 。 试 着 从 该 查 


询 包含 了 相关 于 查 询 这 一 事实 中 寻找 原因 。 


3.7 ”怎样 才能 说 明 SQL Select 语 句 确实 提供 了 关系 代数 所 具备 的 全 部 能 力 ? 回顾 2.8 节 的 
内 容 : 关系 代数 的 所 有 和信 种 运算 ( 列 在 2.5 节 的 末尾 ) 都 可 以 用 五 种 基本 运算 一 -UNION、 
DIFFERENCE、PRODUCT 、pPROJECT 和 SELECT 来 表示 。 假 定 在 SQL 数据 库 中 已 存在 两 个 
由 Create Table 语 句 创建 的 被 称 做 基本 到 的 表 R 和 5S。 

解释 如 和 何 用 SQL Selecti 首 名 来 检索 下 列 任 -一 结果 表 : 


(a)s 


(b) 


{Cyn 


(d) 


(ey® 


RUNIONS 

关系 代数 中 的 R MINUS 5, R TIMES 5S, R[subset of columns], R WHERE 
<condition>。 对 子 查询 只 能 使 用 NOT EXISTS 谓词。 假定 R 和 8 在 必要 的 时 候 具 
有 一 致 的 表 头 。 

[ 难 ] 到 现在 为 止 ，SQL Select 语 名 的 能 力 还 没有 全 部 展现 出 来 ， 因 为 在 关系 代 
数 中 可 能 出 现 递归 表达 式 ， 而 在 SQL Seleer 语 名 中 则 不 可 能 。 比 如 .假定 及 、S 
和 T 是 兼容 的 表 并 且 都 具有 表 头 A… An ， 解释 怎样 才能 用 SQL Select 语 何 来 表 
小 关系 代数 表达 式 (R UNION S) MINUS T。 

[非常 难 ; 短 要 数学 基础 ] 证 明 如 果 U 和 V 代 表 由 SQL Select 语 句 在 基本 表 上 实现 
的 任意 深度 的 关系 代数 递归 表达 式 ， 那 么 我 们 也 能 用 SQL Select 语 句 来 实现 更 
深 的 递归 ; 

U UNION V U MINUS YU TIMES VY, Ulsubset of 

columns], U WHERE <condition> 

[非常 难 ] 回顾 定理 2.8.3: R DIVIDEBY 8 可 以 由 投影 、 差 以 及 乘积 来 表示 。 令 
R 代 表 SQL 语 名 “select cid，aid from orders:"， S$ 民 表 “select 
aid from agents where city = 'New York';”。 这 样 ,，R 
DIVIDEBY S 将 给 出 与 例 3.5.2 相 同 的 答案 。 利 用 公式 2.8.3 并 用 一 个 SQL Select 
语句 来 表示 R DIVIDEBY S$， 然 后 运行 该 语句 以 确认 它 给 出 了 正确 的 答案 。 


注意 下 面 三 道 习题 需要 3.6 节 所 介绍 的 SQL 特征 ， 这些 特征 对 关系 代数 { 第 2 章 的 内 容 ) 
所 提供 的 能 力 进 行 了 扩展 但 还 没有 得 到 大 多 数 数 据 库 产品 的 支持 。 一 般 说 米 ， 你 只 能 
用 ORACLE 版 本 8 或 更 新 版 本 来 在 线 地 执行 这 些 习 题 ， 或 者 还 可 以 用 DB2 UDB。 关 于 高 
级 SQL 的 更 多 应 用 参见 习题 3.18 和 和 3.19。 
3.8 (as 写 一 个 不 售 WHERE 子 名 的 Select 语 句 来 检索 所 有 顾客 的 cia 值 以 及 每 个 顾客 在 
每 样 产 品 上 的 最 大 花费 。 将 结果 表 中 的 列 记 为 : cid，MAXSPENT。 
(b) 写 一 个 查询 来 检索 查询 (好 中 的 MAXSPENT 的 平均 值 AVERAGE (对 所 有 的 顾客 
而 言 )。 
(c) 可 以 不 用 3.6 节 所 介绍 的 新 特性 来 解决 (bp) 吗 ? 
3.9 ”解释 为 什么 引用 3.6 节 所 介绍 的 特性 会 使 习题 3.7 的 (d) 的 证 明 变 得 更 容易 ( 了 递归 有 
关 ) 【附加 题 : 如果 可 以 的 话 ， 证 明 该 结论 。) 
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3.10 (a)* 假定 有 一 个 由 搜索 条 件 WHERE C 确 定 的 custcomers 表 的 小 子 集 C1500 000 个 
题 客 记录 中 的 10 行 )。 另 外 ， 还 有 一 个 包含 顾客 订货 记录 的 sporders 表 ， 其 中 
的 顾客 与 子 集 CC 大 致 (但 可 能 不 完全 ) 相同 。 我 们 想 打 印 一 份 报表 : ciq， 
cname ，TOTDOLL。 其 中 ，TOTDOLL 是 sporderg 表 中 的 每 个 顾客 的 总 订货 
金额 SUM(dollars)。 该 报表 要 反映 出 下 面 这 种 情况 : 在 sporders 表 中 出 现 的 顾 
客 不 在 子 集 C 中 (在 cmname 列 上 显示 一 个 空 值 即 可 ) ; 同时 ， 它 不 能 包含 在 
sporders 表 中 没有 订货 记录 的 顾客 〈 不 管 他 是 否 在 C 中 )【 也 就 是 说 ， 要 避免 显示 
大 约 $00 000 - 10 个 在 TOTDOLL 上 为 空 值 的 顾客 )。 什么 样 的 SQL 语句 能 实现 上 
述 请 求 ? 
(b) 列 出 子 集 C 所 包含 的 在 sporders 表 中 没有 订货 记录 “TOTDOLL 的 值 为 空 ) 的 
所 有 有 顾客。 什么 样 的 SQL 语句 可 以 实现 该 请 求 ? 


注意 ”后面 的 许多 习题 都 需要 在 3.6 节 之 后 介绍 的 SQEL 功 能 ， 这 些 功能 对 关系 代 才 {第 2 
章 的 内 容 ) 所 提供 的 能 力 进 行 了 扩展 并 且 在 所 有 的 主要 数据 库 产品 中 都 得 到 了 广泛 的 
磋 用 , 

3.11 “用 我 们 所 提供 的 基本 SQL 标准 (在 3.6 节 之 外 ) 来 编写 能 完成 下 列 任 务 的 SQL 语 何 ， 
然后 运行 这 些 语句 。 同 时 ， 想 -~- 想 恕 何 用 3.6 节 的 扩展 功能 来 编 与 相应 的 SQL 博 可 【不 作 硬 性 
要 求 )。 

(a)* 为 每 个 有 订货 记录 的 代理 商 列 出 他 上 所 订购 的 每 样 产品 的 pid 值 以 及 所 有 通过 该 
代理 商 订 购 该 产品 的 顾客 们 所 订购 的 总 量 。 

(b) 如 果 和 A 是 orders 表 中 所 有 满足 cig = x 且 pjdQ - y 的 行 的 avg (qty) ， 那 我 
们 称 顾 客 x 以 平均 量 A 订 购 了 一 个 产品 y。 可 以 用 一 个 SQL 语句 求 出 以 至 少 300 的 
平均 量 订 购 了 他 们 所 收 到 的 每 样 产 品 的 顾客 的 cid 值 吗 ? 

tc)* 求 出 设 有 为 任何 住 在 Duluth 的 顾客 订购 任何 在 Dallas 生 产 的 产品 的 找 理 商 的 aid 
值 。 

{d) 求 出 为 住 在 Duluth 或 Kyoto 的 所 有 顾客 订购 了 至 少 一 样 公 共产 品 的 代理 商 的 aiq 
值 。 

(e)* 求 出 只 通过 代理 商 a03 或 a05 订 货 的 顾客 的 ciq 值 。 

(f) 求 出 被 所 有 住 在 Dallas 的 顾客 都 订购 了 的 产品 的 pid 依 。 

(g)* 使 用 集合 函数 max 来 找 出 拥有 最 高 percent《【 佣金 百分率 ) 的 代理 商 。 

fh) 在 agents 表 中 ， 删 除名 为 Gray 的 代理 博 所 在 的 行 ， 以 完整 的 形式 打印 出 结果 
表 ， 然 后 用 Insert 语 句 将 Gray 所 在 的 行 放 回 原 表 。 

(i)* 用 Update 语 名 把 Gray 的 percent 值 收成 11。 然 后 再 改 回 来 。 

(用 一 个 Update 语 句 把 存放 在 Duluth 或 Dallas 的 所 有 产品 的 价格 提高 10 史 。 然 后 ， 
重新 运行 最 初 用 于 创建 products 表 并 导 八 数据 的 过 程 以 恢复 表 中 的 原 值 。 

(kK)* 写 一 个 SQL 查 询 来 检索 订购 了 至 少 .一 样 产品 但 所 有 的 产品 都 只 通过 代理 座 a04 
来 订购 的 顾客 的 ciq 值 。 该 查询 还 应 在 每 人 cia 值 所 在 的 同 一 行 上 列 出 每 个 顾 
客 的 总 订货 金额 。 

(1) 写 一 个 SQEL 查 调 来 求 出 为 住 在 Duluth 的 所 有 顾客 订货 的 代理 庙 的 aia 和 和 
percent 值 。 按 照 percent 值 从 大 到 小 的 顺序 排列 结果 中 的 aid 值 。( 注意 ， 
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如 果 选 择 列 表 中 没有 包含 percent， 那 就 不 能 根据 该 列 的 值 来 排序 。) 
(m)s 写 一 个 SQL 查 询 来 求 出 满足 下 列 条 件 的 产品 的 pid 什 : 该 产品 被 至 少 一 个 顾客 
订 网 ; 每 个 顾客 与 为 他 订购 该 产品 的 代理 商 往 在 同一 城中 ， 
3.12 “” 布 题 要 求 你 在 上 机 验证 查询 结果 以 前 写 下 你 认为 SQL 会 给 出 的 符 案 。 这 里 的 关键 在 
于 理解 SQL 得 出 这 个 答案 的 过 程 。 
(a)* 说 明 下 列 查询 生成 结果 的 过 程 ， 即 列 出 所 创建 的 每 个 子 查 疝 元 素 集 合 ， 然 后 与 
出 你 预想 的 最 终 管 案 。 


select city from customers Where discnt aa] 
{select distnt from customers where city = Duluth" 
union select city trom agents where percent arny 
tselect percent from agents where tity 11ke" Ne" ); 


(b) 用 文字 说 明 SQL 是 怎样 得 出 下 列 查询 的 结果 的 ， 然 后 与 出 你 有 撰 想 的 竺 案 。 


selert cid, pid, sumtqtyy) from orders 
where dollars 2= HOO.0o 
group by cid, pid having countigty) > 1; 
3.13 ”本 习题 所 研究 的 问题 是 : 什么 样 的 SQL 查 询 在 不 使 用 关键 词 DISTINCT 的 情况 下 必 
定 能 返回 没有 重复 行 的 结果 表 ? 这 可 能 是 一 个 很 重要 的 辣 题 ， 因 为 在 不 必要 的 时 候 司 用 关键 
词 PISTINCT 会 导致 资源 的 浪费 。 我 们 在 下 面 列 出 不 返回 重复 行 的 查询 所 遵循 的 -系列 规 由 ， 
并 要 求 你 做 到 :《1) 解释 为 什么 每 条 规则 都 能 奏效 ; (对 每 条 规则 ， 用 一 个 例子 说 明 当 违反 
该 规则 时 查询 可 能 返回 重复 行 。 在 (2) 和 (b) 中 ， 我 们 仅 考 虚 既 不 包含 子 查询 也 不 带 有 GROUP 
BY 村 侣 的 查阅 。 
(a)。 芷 FROM 子 句 只 包含 -个 豆 的 查询 中 ， 如 果 选 择 列表 中 的 列 构 成 了 该 表 的 超 键 ， 
那么 返回 的 结果 表 就 不 包含 重复 行 。 
(b) 在 FROM 子 句 包含 多 个 表 的 查询 中 ， 如 果 对 其 中 的 每 一 个 表 ， 总 能 在 选择 列表 
中 找 出 某 个 构成 该 表 超 键 的 列 集 ， 那 么 返回 的 结案 表 束 不 包含 重复 行 。 
(c)* 没有 一 个 包含 GROUP BY 子 句 的 查询 会 返回 重复 行 这 一 命题 为 真 吗 ? 如 果 为 
真 ， 解释 原因 ; 否则 ， 给 出 一 个 反例 。 
(td) 在 WHERE 子 名 含有 子 查 询 的 Select 语 名 中 ， 至 少 在 类 似 上 述 (a} 和 {b) 的 情况 下 
该 查询 能 保证 返回 的 行 都 是 独一无二 的 。 然 而 ， 习 题 3.4{b) 中 的 形式 转换 (从 
子 查 询 形 式 转换 成 未 用 子 查 询 的 连接 形式 ) 可 能 会 导致 重复 行 ， 除 非 在 选择 列 
表 前 面 使 用 关键 词 DISTINCT。 给 出 一 个 本 来 不 返回 重复 行 但 在 这 种 转换 中 广 
生 了 重复 行 的 但 询 倒 于 。 
3.14 (a)* 重 写 例 3.9.4 的 查询 : 不 要 用 任何 部 分 匹配 模式 的 形式 而 仅 用 比较 者 词 。 
fb) 你 能 找 出 一 个 不 能 被 其 他 谓词 形式 蔡 代 的 模式 吗 ? 
3.15 回顾 2.10 节 的 外 连接 定义 。 考 虑 {一 般 的) 连接 查询 : 


select a,aname, a.3aid, sumtx. dollars) 
from agents a,orders 其 
where a.afd = .aid group by a.aid, .aname; 


(a)* 用 基本 SQL 重 写 该 查询 以 实现 一 个 外 连接 (这 需要 对 三 个 子 查 疝 进 行 并 探 作 )。 
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即使 一 个 代理 商 设 有 订购 和 任何 产品 ， 他 的 aname 和 aid 也 应 该 出 现 ; 即使 一 
个 代理 商 在 agents 表 中 没有 相对 应 的 aia， 他 在 orders 表 中 的 有 关 信 息 
( 根据 aid 值 分 了 组 ) 也 应 该 出 现 ; 当 列 上 不 存在 合适 的 值 时 ， 将 aname 或 
sum (x .dollars) 的 列 值 设 成 常数 null ( 如 果 系 统 不 允许 使 用 空 值 ， 记 可 以 
使 用 空格 和 零 ) 
fb) 为 了 检验 (a) 的 答案 ， 往 orders 表 中 插入 一 个 新 的 行 ， 01027.jon', ‘e001', 'a07" 
‘PO1', 1000, 450.00); 往 agents 表 中 捅 人 一 个 新 的 行 : (a08', 'Beowulf', 
'London', 8) ， 然 后 运行 该 查询 。 当 你 对 结果 感到 满意 的 时 候 ， 再 删除 财 才 插入 
的 姥 两 行 。 
3.16 下面 的 习题 说 明了 空 值 的 一 些 特殊 炸 质 。 为 了 完成 该 习题 ， 我 们 往 agents 表 中 揪 
入 一 些 在 percent 列 上 为 空 仁 的 新 行 (并 在 习题 结束 以 后 把 它们 从 表 中 删 去 ) 我 们 执行 两 
个 Inserti 语 菇 : 


insert into agents taid, aname, city) 
Yalues {a07F' , Green' ‘Geneva ): 
insert into agents (aid, aname, city) 
Yalues 1 ad’ , "Whiter ,NeEwarkK" ); 


(a)* 预测 下 列 语 名 的 结果 ， 然 后 运行 该 语句 验证 你 的 管 案 。 这 里 的 问题 是 : 在 
GROUP BY 子 甸 中 ， 空 值 是 如 何 运 作 的 ? 
select percent from agents group by percent.; 

(b) 预测 下 列 语句 的 结果 ， 然 后 运行 该 语 避 。 这 里 的 问题 是 ， 当 与 别 的 值 . :起 排序 
时 ， 空 值 是 如 何 和 运作 的 ? 
select aid, percent from agents order by percent: 


(cs 考 虚 下 面 的 查询 : 


select distinct aname from agents where percent >=all 


【select percent from agents where City = ‘Geneva" }: 


(i) 用 文子 来 表述 该 坦 向 :“ 获 得 .….. 代 理 商 的 名 字 ” 

(i 注意 这 里 的 子 查询 将 返回 单个 空 值 。 在 这 种 情 认 下， 对 agentg 表 中 的 所 有 
pezrcent 和 值 ，>ALL 谓 词 的 结 昌 均 为 森 知 。 这 样 ， 你 认为 该 查询 的 结 征 会 是 
什么 ?运行 起 查询 以 验证 你 的 想法 。 

(d) 以 问 样 的 方式 考虑 下 面 的 查询 ， 并 完成 类 似 于 (ce) 中 (让 和 (i 的 练习 。 

select distinct aname from agents a where not exists 

rselect * from agents b 


where b.city = ‘Geneva' 
and a.percent <= b.percent}: 


你 是 否认 为 该 查询 的 效果 等 问 于 问题 (c) 的 黎 果 ?但 这 里 有 一 个 惊 入 之 处 : 由 于 队 -满足 
pb.city = 'Geneva ' 的 行 具有 性 质 b.percent = null， 而 所 有 其 他 percent 值 与 空 值 
的 比较 结果 为 UNKNOWN， 所 以 这 里 的 子 查询 将 返回 一 个 空 集 并 且 对 所 有 代理 商 a， NOT 
BEBXISTS 的 结果 均 为 TRUE。 这 显然 不 是 (ec) 的 结果 。 

3.17 ”仔细 体会 “ALL 意 味 着 没有 反例 ”这 句 话 。 假 设 我 们 对 例 3.5.2 进 行 了 修改 : 把 New 
York 改 成 了 Los Angeles。 
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(a)* 现在 的 答案 是 什么 ? 

(b) 解释 原因 。 

3.18 在 例 3.11.5 中 ， 我 们 看 到 规定 的 报表 不 可 能 由 一 个 基本 SQL 请 名 生成 。 

(alj* 说 明 如 何 用 多 个 基本 SQL 语 名 (前面 的 语句 创建 后 面 语句 所 需 的 表 ) 来 生成 规 
定 的 报表 。 首 先 ， 创建 宽度 为 500.00 的 块 ， 低 去 dol1larsi/500.00 的 小 数 部 分 从 
而 得 到 一 个 整 卉 的 .“ 桶 号 ”"。 比 如 ，750.00/500.00 = 1.5， 售 去 小 数 部 分 后 得 到 
的 桶 号 为 1。 接 下 来 ， 用 Create Table 语 名 创建 一 个 存放 桶 号 的 表 buckets， 已 
有 一 个 名 为 bucket 的 整数 列 。 以 三 种 最 常用 的 数据 库 产品 为 例 : 在 ORACLE 
中 ， 可 以 用 floor( ) 函 数 来 对 任 一 数字 的 小 数 部 分 进行 四 舍 五 入 从 而 得 到 … 个 整 
数 ; 在 DB2 UDB 和 INFORMIX 系 统 中 ， 可 以 用 一 个 CAST 表 达 式 来 把 美元 值 转 
挽 成 桶 号 。 由 于 这 些 桶 号 在 buckets 中 被 具体 化 了 ， 所 以 你 最 终 可 以 通过 连接 
orders 表 和 btapb 表 来 实现 必要 的 分 和 组。( 注意 有 些 系 统 在 实现 CAST 的 时 候 可 
能 采用 了 四 低 二 入 而 不 是 下 会 入 。 在 那 种 情况 下 ， 币 要 使 用 表达 式 : cast 

({ dollars+250.005) /500.00-1 as integer)， 额 外 的 0.005 确 保 了 0 
美元 被 转换 成 桶 号 0; 500.00 被 转 按 成 1; 依 此 类 推 .) 

fb) 利用 3.6 节 所 介绍 的 高 级 SQL 特征 【在 DRACLE 和 DB2 UDB 中 得 到 了 实现 ) 来 与 
一 个 生成 此 报表 的 查询 。 这 里 的 下 舍 人 运算 可 以 由 floor( ) 或 CAST 表 达 式 来 完成 。 
你 所 需要 的 特殊 的 高 级 SQL 特征 是 把 一 个 子 查询 放 在 FROM 了 于 何 中 。 

3.19 在 例 3.11.3 中 ， 我 们 讽 法 用 一 个 基本 SQL 语句 来 完成 中 值 (median ) 的 计算 。 说 明 如 
何 分 别 用 多 个 基本 SQL 语句 以 及 一 个 【很 长 的 ) 高 级 SQL 语句 来 计算 中 值 。 

(a) 使 用 客 个 基本 SQL 语句 。 创 建 表 relhist (relative frequency histogram， 相 对 
频率 直方 图 )， 它 包 含 了 dol1lars 和 值 以 及 这 些 值 各 自在 corders 表 中 的 出 现 次 数 。 
例如 ， dollars =720.00 的 行 的 出 现 次 数 为 2。 创 建 男 一 个 表 
cumnist(cumulative frequency histogram， 累 积 皮 率直 方 图 ), 它 包含 了 小 于 或 等 
于 每 个 特定 ao11lLars 值 的 所 有 dollars 值 的 出 再 次 数 。 例 妇 ，qollLars = 
400 .00 的 行 的 累积 次 数 为 2， 其 中 一 次 是 对 值 400.00， 另 一 次 是 对 值 180.00。 查 
询 第 二 个 表 以 求 出 中 值 。 

(bh* 利用 高 级 SQL 特征 来 写 一 个 产生 该 报表 的 查 向 。 

3.20 如 前 所 述 ，ORACLE 有 能 力 执行 传递 闭 包 型 的 查询 。 创 建 例 3.11.6 所 示 的 
employees 表 ， 然 后 运行 该 例 后 正文 中 的 CONNECT BY 查询 。 


第 4 章 对象- 关系 SQL 


本 章 介 绍 数据 库 管 理 系 统 的 对 象 -关系 模型 (ORDBMS)， 并 将 其 和 我 们 前 这 的 章节 中 介绍 
的 老 的 关系 PBMS ( RDBMS ) 模型 相 比 较 。ANSLISO SQL-99 标准 提出 了 支持 ORDPBM3 模 
型 的 SQL 语言 标准 ， 我 们 介绍 过 的 三 个 主要 的 数据 库 产品 PB2 UDB ，DRACLE 和 INFORMIX 
都 支持 数据 库 ORDBMS SQL 语言 (然而 ， 这 三 个 产品 在 一 些 基本 请 法 元 素 上 有 些 差 异 )。 尽 
管 数据 库 厂 商 MICROSOFT 和 SYBASE 企 本 书 撰写 时 尚未 发 布 支持 ORDBMS 的 产品 ， 其 产品 
却 有 朝 这 一 方向 发 展 的 趋势 。 我 们 将 在 本 章 中 对 DORDBMS 进 行 详细 的 介绍 . 由 于 向 上 兼容 性 ， 
DRDBMS 产 品 同样 支持 RPBMS SQL， 因 此 ， 我 们 有 时 也 将 这 些 产品 称 为 RDBMS/AORDBMS 
类 的 数据 库 产品 。 

尽管 [BM 的 DB2 UDB 已 经 具有 强大 的 对 每 -关系 编程 界面 ， 它 对 交互 式 的 ORDBMS SQL 
特征 的 支持 是 在 我 们 开始 撰写 本 章 之 后 不 和 久 ， 稍 上 晚 于 其 他 数据 库 产品 。 上 鉴于 此 ， 在 当 脏 的 章 
车 中， 我们 仅 涵 盖 ORACLE 和 INFORMIX 的 ORDBMS 特 征 。 由 于 ORDBMS 是 一 个 全 新 的 模 
型 ， 在 本 书 新 版 洒 发 布 之 前 ， 在 这 一 领域 内 可 能 存在 其 他 方面 的 变化 ， 因 此 ， 我 们 推荐 读者 
访问 我 们 正 交 的 互联 网 主页 以 获取 关于 ORDBMS 和 其 他 主题 最 新 资料 。 主 页 和 的 URL 为 
http:Awwww,cs. umb.edu/~poneiydbppp.htm!l, 


4.1 引言 


目前 存在 着 几 种 不 同 的 ORDBMS SQL“ 方 言 "。 每 个 产品 都 有 其 自己 独特 的 方言 ， 甚 至 
是 SQL-99 模 型 和 语法 在 被 采纳 之 前 的 最 后 几 年 也 经 历 了 巨 天 的 变化 。 在 我 们 的 讨论 中 ， 为 采 
用 一 般 性 的 术语 ， 我 们 将 大 多 数 ORDBMS SQL 方 言 公 用 的 概念 表示 为 QORSQL。 内 此 ， 我 们 
使 用 的 DRSQL 术 语 未 必 对 所 有 的 DRDBMS 产 品 都 准确 -。 

我 们 从 对 ORSQL 的 能 力 的 总 的 看 法 来 开始 末节 ， 包 括 多 个 DRSQL 标 准 和 方言 以 及 我 们 在 
表述 中 如 何 处 理 这 些 ORSQL。 

1. ORSOQL 的 能 力 

DORSQL 的 对 和 象 -关系 异型 支持 用 户 对 象 定 只 一 一 我 们 习惯 将 ORSQL 中 年 六 的 对 象 看 做 行 ， 
即 一 组 可 以 存储 在 一 个 表 中 的 某 类 型 的 数值 。 我 们 将 ORACLE 中 的 对 象 类 型 、INFORMIX 中 
的 行 类 型 及 DB2 UDB 中 的 用 户 定 义 类 型 (UTD ) 称 为 行 (或 对 象 ) 及 其 其 型 的 属性 的 格式 。 
由 于 用 户 定义 类 型 同样 适用 于 SQL-99 标 准 ， 一 般 我 们 记 将 在 ORSQL 中 采用 这 一 术语 。 这 样 ， 
一 个 表 可 定义 为 包 合 用户 定义 类 型 的 多 个 行 (或 对 象 )。 此 外 ， 表 内 的 一 列 可 定义 为 包含 -: 个 
用 户 定义 类 型 的 值 ( 即 一 个 列 可 以 有 像 行 一 样 的 值 )。 

(1) 汇集 类 者 (COLLECTION TYPE) 

另外 ， 对 象 -关系 模型 允许 一 个 行 包括 一 个 行 值 汇集 (或 一 些 其 他 汇集 类 型 ， 如 数组 }。 
在 一 些 系统 中 ， 单 个 列 自身 可 拥有 一 个 表 ， 称 为 景 套 的 表 。 在 其 他 情况 下 ， 这 样 的 对 锭 汇集 
可 转化 为 一 个 表 ， 从 而 使 SQL 检索 的 概念 也 可 作用 于 汇集 。 所 有 这 些 都 违反 了 关系 模型 的 第 
一 范式 秽 出 。 我 们 将 2.3 节 中 描述 的 第 一 范式 规则 重 述 如 下 。 
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规则 1 第 一 范式 在 表 的 定义 中 ， 关 系 模型 不 允许 列 中 出 现形 如 多 值 域 ( 有 时 称 为 重复 
域 ) 或 任何 内 部 的 数据 结构 ( 如 记录 ), 狂 足 这 样 的 条 件 的 去 即 是 第 :范式 的 表 。 

对 象 -关系 模型 允许 包含 多 个 值 或 结 梅 化 数 撕 值 ， 违 反 了 第 一 范式 规则 . 图 4-1 给 出 了 -个 对 
象 - 关 系 employees 表 的 例子 ， 其 中 ， 列 dependents 包 含 结构 (两 个 属性 dep_name 利 
dep_age ) 并 且 每 个 行 中 包含 多 个 值 (如 雇员 001, John Smith 有 两 个 家 属 , Michael]. 和 Suan R. ),， 


mp 1 DYe5 


EE i 


ea 
On | Smith, john 页 FenT 
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EC 
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图 4-1 带 有 多 个 从 属 韦 局 性 值 的 雁 贞 表 








{2) 方 法 和 UDF 

在 诸如 Java 的 面向 对 象 场 言 中 ， 在 一 对 象 中 的 秘 有 数据 仪 能 通过 对 象 方 法 访问 ; 这 些 方法 
是 可 被 调用 来 作用 于 特定 对 象 的 图 数 。 通 党 地 ， 对 象 的 方法 集合 将 处 理 对 象 能 被 孤立 对 待 的 所 
有 特性 。 例 如， 对 一 个 简单 的 银行 账户 对 象 ， 我 们 可 能 有 方法 get balancet)， 
make_depositt}) 和 和 make_withdrawalt}) 及 创立 和 删除 对 象 的 方法 ,一 些 广 法 ， 如 
get_balarcef)， 仅 读 取 对 象 数据 并 返回 信息 给 调用 者 。 其 他 方法 ， 旭 make_depesit1) 和 
make_withdrawalt)， 则 修改 对 象 中 的 数据 。 在 纯 面向 对 象 的 环境 中 【其 中 所 有 的 数据 者 是 
私有 的 1)， 由 于 没有 其 他 方式 可 以 操纵 对 象 ，… 个 对 象 类 的 方法 的 汇集 刻画 了 该 类 (的 行为 小 

我 们 在 本 章 中 研究 的 对 每 总 介 许 ORSQL 直接 访问 对 象 的 各 个 部 分 , 因此 ,在 QRDBMS 中 ， 
所 有 的 对 象 被 看 做 是 公共 的 而 非 私有 的 。 在 稍 后 的 一 些 章节 中 .我们 通过 通用 的 ORSQL 访 问 
来 处 理 对 象 。 然 后 解释 如 何 写 对 象 方法 ， 这 些 方法 是 “依附 ”于 对 象 的 函数 ， 髓 说 明 如 何 编 
写 蝎 通用 的 用 户 定 尽 函数 (UDF })，UDF 消 数 不 完 全 的 “依附 ”十 对 象 ， 但 可 以 将 凶 个 不 同 的 
对 象 当 作 同 等 重要 的 参数 。 

2. 本 章 的 表述 形式 

在 本 章 中 ， 我 们 将 以 两 种 商用 产品 ORACLE 和 INFORMIX 为 例 介 绍 对 象 -关系 的 概念 。 这 
两 个 产品 在 设计 和 命名 系统 上 有 较 大 的 区 别 , 这 种 显著 的 差异 使 我 们 感到 有 必要 对 这 两 种 产 
品 分 别 加 以 介绍 。 鉴 于 此 ， 我 们 打算 在 不 同 的 小 节 中 分 别 对 这 两 种 产品 这 -… 介 绍 . 例如 ， 在 
4.2 节 “对 象 和 表 ” 中 , 我 们 给 出 了 大 量 的 基本 定义 和 例子 : 4.2.1 节 复 盖 “ORACLE 对 象 类 型 ”， 
4.2.2 节 则 覆盖 “INFORMIX 对 象 行 类 型 ”。 

一 个 非常 重要 的 观点 : 我 们 建议 读者 通读 本 书包 括 两 种 产品 的 连续 的 章节 ， 无 论 你 是 否 
对 两 种 产品 都 感 兴 超 。 因 为 在 不 同 的 小 节 中 介绍 的 不 同 的 产品 的 概念 对 上 上 确 理 解 对 象 - 关 系 模 
型 是 十 分 重要 的 。 由 于 对 ORACLE 的 介绍 覆盖 了 每 一 他 ， 读 省 可 以 在 不 失 连 续 性 的 情 部 下 有 
意 地 跳 过 关于 INFORMIX 的 小 节 ， 但 仅 研 究 一 种 产品 将 在 一 定 程度 上 牺 特 对 对 象 - 关 系 模型 理 
解 的 广度 。 
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3. 对 象 - 关 系 的 历史 

有 许多 原因 导致 了 了 对象- 关系 模型 的 形成 和 发 展 。 在 初期 ， 对 说 如 Smallta 永 和 C++ 等 面向 对 
象 语言 的 兴趣 使 得 研究 者 们 试 奥 开发 可 以 和 这 些 语言 日 然 地 交互 的 数据 库 系 统 。80 年 代 中 期 ， 
大 鞭 的 面向 对 人 象 数 据 库 系统 {OODBS ) 开始 出 现 。 这 些 DODBS 产 品 通过 提 性 衬 久 变量 (这 里 
的 持久 这 个 阅 与 社 久 让 刍 器 有 相同 的 含义 ) 扩展 了 面 操 对 象 程序 语言 。 其 思想 是 存 诸 如 C++ 的 
语 百 中 ， -个 变量 J 首 先 被 声明 为 “持久 的 ”， 然 后 可 以 在 语言 中 以 -种 日 然 的 方式 被 更 新 ， 如 
通过 写 一 行 诸如 J-J+I 的 程序 代码 。 下 层 的 DODBS 将 按 如 下 方式 处 理 变量 IT， 当 吏 新 J 的 程序 完 
成 后 ， 和 的 新 值 将 被 自动 地 情 让 在 持久 储存 器 中 ， 并 且 ， 当 这 样 的 程序 再 次 执行 时 ， 它 将 访问 
保存 过 的 J 值 . 在 OODBS 模 型 中 ，SQL 语 名 不 蚌 必 须 的 ， 数 组 和 类 (或 封装 的 结构 ) 等 复杂 对 
象 呈 用 十 保存 数据 ， 这 样 的 复杂 对 象 区 其 适用 于 诸如 机 器 部 件 设 计 等 应 用 场合 ， 在 机 器 部 件 设 
计 中 一 些 机 器 部 件 有 带 有 数 干 个 子 部 件 的 极为 详细 的 装配 部 件 。 在 关系 数据 库 中 构造 这 样 的 设 
计 模 型 需要 大 量 的 不 同类 型 的 关系 表 回 的 连接 运算 ， 在 编码 时 是 很 困难 的 并 县 执 行 这 样 的 运算 
的 效 痪 将 十 分 低下 ， 市 C++ 人 允许 使 用 更 复杂 的 结构 ， 订 以 很 自然 地 构造 这 样 的 模型 。 

尽管 OOPBSHU 能 对 于 某 些 应 用 是 最 好 的 选择 ， 们 早期 的 DODBS 产 品 疫 有 “ 表 ” 的 概念 ， 
且 查 疝 也 是 十 分 简单 的 ,尽管 后 来 的 GODBS 产 品 对 此 做 了 很 多 的 改进 ， 但 许多 年 来 -~ 直 习惯 于 
“ 填 琢 "、“ 对 一 个 空间 返回 一 个 答案 ”方式 的 关系 模型 的 商业 客户 发 现 关 系 模型 已 经 能 够 很 好 地 
满足 他 们 的 要 求 ， 不 愿意 青 用 对 象 模型 重复 实现 他 们 的 应 用 。 结 果 使 得 QODBS 产 品 ( 如 来 自 
Object Design 、Versant、Gemstone 和 Objectivity 等 公司 的 产品 ) 只 占有 很 小 的 -一 部 分 市 场 份额 ， 其 
销售 额 仅 是 RDBMSVAORDBMS 产 品 的 一 部 分 。 鉴 于 此 ， 我 们 在 本 书 中 将 集中 介绍 ORPBMS 模 现 。 

ORDBMS 模 型 的 发 展 满足 了 许 饮 应 用 的 需要 。 首 先 ， -范式 规则 被 认为 是 不 必要 的 限制 ， 
太 量 的 支持 “ 般 苞 关系 ”的 非 一 范式 的 模型 的 大 量 的 论文 被 发 表 ，IBM 当 时 交 持 对 这 种 模型 
的 商业 研究 ， 同 时 ， 许 多 研究 大 员 开 始 开发 这 样 的 原型 系统 。 商 业 用 户 最 终 将 语意 接 受 这 种 
对 关系 表 的 消除 “对 -- 个 空间 返回 一 个 答案 ”的 限制 的 革命 性 变化 。 早期 最 重要 的 对 银 - 关 系 
原型 系统 产品 是 如 州 天 学 但 克利 分 校 的 Michael Stonebraker 提 出 POSTGRES 系 统 。( 关 于 
POSTGRES 系统 和 Michael Stonebraker 对 对 象 关 系 模 型 的 论述 请 参阅 本 音 末 的 “参考 读 
物 ”。)JPOSTGRES 系 统 后 来 证 发 展 成 为 商业 产品 (由 于 版 权 的 原因 ， 这 个 系统 加 上 了 以 Iluatra 
结尾 的 产品 系列 名 )。 最 后 ， 在 1996 年 IYFORMIX 购 买 了 Jllustra 产 品 ， 并 在 此 基础 上 开发 了 他 
们 的 ORDBMS 产 品 。ORACLE 人 公司 则 在 1997 年 推出 ORACLE 的 对 象 -关系 版 ， 即 版 本 8。 
ANSIAISO SQL-99 组 织 发 布 的 SQL-99( 官 方 称 为 SQL:1999) 标 准 是 -一 个 对 象 -关系 的 标准 。 实 际 
上 上 ，ANSIISO SQL-99 组 织 在 1994 年 就 开始 了 对 该 标准 的 制定 ， 但 该 标准 的 多 次 改动 花 了 很 
长 揭 时 间 ， 结 果 具 有 对 象 -关系 特征 的 数据 库 产品 里 在 1999 年 该 标准 发 布 之 前 就 已 经 发 布 了 。 


4.2 对 象 和 表 


在 ORACLE 对 象 关 系数 据 模型 中 ， 我 们 有 一 种 新 的 用 户 定 尽 类 型 ， 即 对 象 类 型 。 我 们 在 
4.2.1 节 中 介绍 新 对 象 类 型 的 合用。 在 INFORMI]X 中 ，ORACLE 的 对 象 类 型 被 称 为 行 类 型 ， 我 


们 将 在 4.2.2 节 中 介绍 行 类 型 
42.1 ORAGCLE 中 的 对 象 类 型 
我 们 首先 说 明 如 何 创建 -个 对 象 类 型 。 我 们 说 一 个 对 象 类 型 有 多 个 类 型 属性 ， 与 一 个 表 
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的 列 相 似 。ORACLE 中 的 一 个 对 象 类 型 由 Create Object Type( 对 象 类 型 创建 语句 生成 ， 创 建 对 
象 类 型 的 例子 如 例 4.2.1 所 示 。 

例 4.2.1 创建 一 个 对 象 类 型 name_t 表 示 一 个 人 的 名 字 ， 和 名 字 中 包括 名 , 姓 , 中 间 名 。 下 
边 是 用 ORACLE 的 交互 SOL 环 境 SOL+Ptus 写 的 一 个 例子 2 。 


ereate type name_t as object -- We call this a “create Dbject Type” statement 
【 
name varchar(t30), -- 1a5t name 
fname varchart3D), -- first name 
mi thartl) -- middle initial 


}; 
-- for Sq1l*Plus, not part of SOL syntax 
该 SQL 语句 执行 后 (字符 被 输 人 以 后 )， 系 统 已 经 记录 了 一 个 新 的 数据 库 类 型 ， 即 对 象 类 型 。 
name 苇 的 属性 为 iname，fname 和 mi。 在 每 一 行 双 短线 -- 后 的 部 分 为 该 属性 的 注释 。 用 
例 4.2.1 以 和 C 中 的 结构 定义 声明 一 个 “结构 类 击 ” 相 同 的 方式 定义 了 一 个 ORACLE 对 象 类 
击 name_t 以 表示 人 名， 但 是 这 种 类 型 的 对 演 仍 未 生成 。 对 此 ， 我 们 必须 创建 一 个 其 中 的 行 
或 列 能 够 包含 对 象 的 表 。 例 4.2.2 中 给 出 了 一 个 其 中 的 列 能 铝 包 含 对 象 的 表 。 
例 4.2.2 创建 名 为 Leachers 的 表 ， 其 中 包 会 二 列 :， 上 ia (教师 的 整 型 标识 ， 整 型 )， 
tname {教师 和 名，name_t 类 型 )，room { 教师 住房 的 编号 ， 整 型 }。 


create table teachers 
t 


t1d int ， 
tname nam 名 二， 
OOM 1nt 


js 
这 是 一 个 空 表 ， 因 此 我 们 仍然 没有 创建 name_t 类 型 的 任何 对 象 。 亿 是， 车 我 们 现在 热 
行 插 人 语句 插 人 行 到 teachers 表 中 ， 在 tname 中 的 列 值 将 使 用 name_t 类 型 的 对 象 值 。 这 样 
一 个 插入 语句 的 例子 如 下 : 


insert into teachers values C1234,. name_ tt"Einstetn’. Albert","E'), 120).; 
| 


在 Insert 语 名 中 使 用 的 VALUES 关 键 字 按照 3.10 节 图 3-22 的 IJnsert 语 铝 的 一 般 形式 的 语法 定 
义 。 被 插入 的 第 二 列 使 用 name_t {…) 的 形式 将 name_t，1Lname，fname 和 mi 等 属性 的 值 
放 在 一 起 构成 tname 列 的 对 象 类 增 name 芋 的 值 。 这 种 cbject_tvpe_namefi 的 形式 从 它 
的 属性 值 构造 对 象 ， 被 称 为 对 象 构 造 器 { 相关 的 细节 所 会 在 下 这 的 图 4-5 中 讨论 ) 显然 ， 在 
reachers 表 的 tname 列 的 定义 破坏 了 关系 规则 1， 因 为 规则 1 禁止 表 的 列 中 出 现 结构 值 。 

我 们 使 用 一 种 “点 号 ” 的 形式 来 访问 例 4,2.2 中 定义 的 Leachers 表 中 的 tname 对 象 列 。 
下 边 先 给 出 一 个 仅 处 理 Eeachers 的 列 的 规则 SQL 语句 : 


select t,tid from teachers t Where 二 .FTOom w= 123:; 


日 ” 当 简 4.2.1 的 半 蒙 类 型 创建 语句 在 S$QL*Plus 坏 境 下 执行 时 ， 北 下 的 分 号 !; 后 必须 跟着 一 个 包含 /的 行 。 阁 一 
个 包含 /的 行 出 现在 我 们 先前 所 介绍 的 语句 中 ， 则 该 语 人 名 将 被 执行 两 次 。 
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现在 ， 我 们 给 出 一 个 处 理 name_t 类 型 列 中 的 属性 的 SQL 语 句 : 

select ttid, t.tname, fname, t.tname.1name from teachers t where t.room = 123; 

在 t .tname .lname 中 使 用 了 了 两 个 点 号 ， 此 一 个 点 号 表示 tname 是 表 t ( teachers 的 别 
名 ;的 列 ， 第 二 个 点 号 表示 lname 是 tname 对 和 象 值 的 一 个 属性 。 尽 管 在 第 3 章 中 我 们 无 须 使 用 
表 的 别名 ( 且 当 FROM 语句 中 只 有 一 个 表 时 ， 可 以 不 用 表 和 名 限定 列 名 )， 查 在 访问 属性 的 
Select 语 名 中 却 不 行 。 我 们 将 在 后 边 对 此 给 予 详 细 的 说 明 ， 在 此 之 前 ， 你 必须 包括 表 的 别名 并 
用 别名 限定 Select 语 句 中 的 所 有 列 ， 除 非 你 能 够 确定 可 以 不 必 如 此 。 特别 地 ， 下 边 是 刚才 提 
下 的 Select 语 品 ， 其 中 的 变量 缺少 对 Ename 访 问 的 表 名 限定 ， 该 语句 无 法 实现 。 


celert tid, tname.fname. tname.1iname from teachers where room 一 123; ** DOESN'T WORK 

一 个 对 象 类 型 可 用 另 ~- 个 对 象 类 型 的 属性 来 定义 。 例 如 在 例 4.2.3 中 ， 我 们 用 一 个 名 为 
pname 的 name_t 属 性 来 定义 一 个 描述 人 的 对 每 类 型 person_t。 

例 4.2.3 ”构造 一 个 分 别 包 含 人 的 社会 保障 导 、 姓 名 和 年 龄 的 对 象 类 型 person_ 上。 构造 
之 前 先 对 person_t 使 用 Drop Type 语 何 清除 所 有 已 经 存在 同名 的 类 型 。 


drop type person_t: 
create type person t as object 


马上 白嫩 int, 
pname name_t,， 
下 如 已 int 


1; 
和 例 4.2.1 一 样 ， 要 使 类 型 创建 语句 在 SQL*Pius 中 执行 我 们 需要 在 其 后 跟 一 -个 带 /的 行 。 是 

为 了 使 person _t 的 定义 语句 能 够 被 让 确 执行 ，name_+ 必 须 是 一 个 已 定 久 的 类 型 ， 这 就 是 
所 说 的 依赖 性 ， 即 pergcn_t 依 顿 于 name_ t+。 试图 删除 一 个 为 另 一 个 类 型 所 依赖 的 类 型 将 产后 
错误 ， 删 除 该 类 型 之 前 必须 删 出 所 有 的 依赖 于 它 的 类 型 。 例 如 ， 各 我 们 迄 图 在 例 4.2.3 的 
pgrson_t 类 型 定 久之 后 删除 name_t 类 型 ， 我 们 必须 先 删除 perscn_t 类 型 及 可 能 依赖 于 
name 七 其 他 所 有 类 型 。 类 型 刘 相 互 依赖 的 信息 可 以 从 系统 维护 的 目录 表 中 得 到 【 见 第 7 章 的 最 
后 一 前 )。 

若 DRACLE 中 的 一 个 表 中 的 行 包含 对 象 类 型 ， 则 该 表 被 称 为 对 象 表 ， 即 每 一 行 由 该 类 型 
的 一 个 对 象 组 成 。 例 4.2.4 构 造 了 -个 由 person t+ 类 型 行 组 成 的 表 。 

例 4.2.4 构造 一 个 包含 perscn_t 对 每 ( 行 ) 的 名 为 people 的 对 象 表 。 使 用 社会 保 伴 号 
作为 表 的 主键 ” 。 


create table people ef person_t 


i 
primary keytssrno) 


+ 


我 们 用 4 行 来 写 沪 语句， 以 便 手 阅读， 当然， 空白 不 影响 其 含义 ， 我 们 可 以 将 该 语句 写 
为 : 


日 ” 带 PRIMARY KEY 列 约束 的 肇 被 隐 含 地 定义 为 非 空 ， 尽 管 NOT NULL 诸 句 和 PRIMARY KEY 语 名 可 能 同时 
中 现 。 守 际 上 ， 许 狗 老 的 数据 库 户 上 品 要 求 被 定 久 为 PRIMARY KEY 的 列 同时 必须 是 NOT NULL。 由 于 仪 有 
新 的 数据 库 产品 其 有 面向 对 和 象 的 扩展 、 我 们 在 本 章 中 使 用 问 一 列 中 不 带 NOT NULL 的 PRIMARKY KEY 定 义 
语句 。 
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treate table people of person tiprimary Keytssno)}; 
生成 的 people 表 的 一 个 例子 如 图 4-2 所 示 。 


people 


包 舍 行 半 象 的 无 名 顶层 媳 EC 





图 4-2 某 一 给 定 册 刻 的 例 4.2.4 的 DRACLE 对 象 表 PecpLe 国 


关系 Create Table 语 句 的 形式 (第 3 章 图 3-2) 在 定义 中 描述 所 有 的 列 名 和 该 列 的 数据 类 
型 。 但 在 对 象 表 中 ， 对 象 属性 提供 了 表 的 列 。 因 此， 在 例 4.2.4 中 ORACLE 的 Create Object 
Type 语句 中 ， 只 需要 描述 对 象 类 型 (person_t) 和 -个 可 选 的 主键 ; person_t 的 属性 
ssno，pname 和 age 变 成 了 peop1le 的 州 名 ， 在 people 中 ， 这些 属性 被 称 为 询 或 项 后 局 性 ， 
由 于 ssne 被 当 作 - 列 ,， 在 对 象 类 型 创建 语句 中 ， 它 可 以 被 描述 为 主键 。 

在 后 边 的 部 分 中 ， 我 们 将 用 于 构造 关系 表 的 Create Table 声 人 铝 称 为 Create Relational 
Table( 关 系 表 创建 ) 语 名 ,将 用 于 构造 对 象 表 的 构造 语句 称 为 Create Object Table( 对 象 表 创建 } 
语句 ， 在 无 须 区 别 芍 情况 下 ， 我 们 将 着 两 种 语句 统称 为 Create Table{ 表 创建 语句 。 

例 4.2.4 的 people 表 涉及 两 个 对 象 类 珊 。person_t 对 象 被 称 为 行 对 象 ， 因 为 它 处 于 表 的 
行 中 。 由 于 象 列 一 样 的 pmame 属 性 自身 又 是 一 个 对 象 类 型 ，Pname 值 被 称 为 列 对 象 。 在 
people 表 中 的 pname 的 属性 可 通过 点 号 来 访问 ， 如 p .pname . 1Lname， 其 中 , p 是 people 
的 别名 ， 但 是 ，p 被 当 和 作 属 性 而 不 是 列 。 在 图 4-2 中 的 “盛名 顾 层 列 ” 表 示 我 们 名 以 用 
VALUEO 关 键 字 的 形式 引用 整个 people 行 对 象 (注意 不 要 和 Insert 语 句 中 的 WALEUS 头 键 子 混 
消 )， 在 非 对 象 的 表 中 这 是 不 可 能 的 。 一 般 地 ， 我 们 在 对 象 表 的 图 中 将 不 会 所 到 无 名 央 层 行 。 

由 于 对 象 表 顶 层 行 属性 扮演 列 的 和 角色， 我 们 可 以 以 常规 的 方式 与 简单 的 查 调 语 句 : 

selerct p.age from pecple p Where p.ssno ~ 123550123; 

我 们 可 以 以 同样 的 方式 显示 列 对 象 pname， 例 如 ， 

selert 了 .pname from peop1a p Where Pp.adge > 25; 

在 pname 列 中 的 name_t 对 象 将 按 形 如 name_t ('Sanchez'， "udose ' ， 了 的 方式 
被 打印 出 来 。， 稍 后 我 们 涪 明 其 细节 。 和 普通 的 表 一 样 ， 在 Select 语句 

select * from pecple hb shere p.age > 29: 

的 选择 列表 中 的 * 形 式 将 显示 所 有 被 选中 的 行 ; 就 对 象 表 而 言 ， 将 显示 所 有 的 顶层 属性 ， 如 
图 4-3 所 示 。 

在 图 4-3 中 ， 非 对 象 列 按照 我 们 所 期 望 的 方式 显示 。pname 列 有 一 :个 显示 属性 名 的 标题 ， 
其 值 包 售 在 对 象 构造 器 name_t (} 中 【在 一 些 系统 中 ，ORACLE 将 每 一 行 的 每 一 列 用 一 个 新 
的 行 来 显示 ， -个 值 在 另 一 个 值 的 下 面 。 这 种 情况 在 一 个 或 多 个 行 表示 对 和 象 时 出 现 ， 但 显示 
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的 形式 将 随 新 的 ORACLE 版 本 的 变化 而 变化 )。 


| 245882134 name t{'Delaney', "Patrick','X’) 
DFOdd455 name_t{'sanchez’','Jose","F') 





图 4-3 ORACLE 的 Select * 查询 的 输出 形式 ， 显 示 所 有 列 


可 以 使 用 另 -种 方式 将 同样 的 数据 显示 为 全 行 对 象 。 这 是 图 4-2 的 顶层 记名 列 所 隐 含 的 方 
式 ， 即 我们 可 以 以 单个 列 值 的 方式 检索 诸如 people 的 对 象 表 的 所 有 列 。 

select valuetp} frem people p where age > 25; 

肯 次 提醒 读者 不 要 将 value {tp) 形式 各 插入 语句 中 的 VALUES 关 键 宁 机 混 清 ， 该 查 疗 的 结 
果 如 图 4-4 所 示 ， 


person_t (245B982134, name_t{'Delaney' , Patrick" ， 1) ， 
Persan t (O23094455, name ti"Sancihez’ , Jose’, 'F']. 





图 4-4 ORACLE 的 Select valuelp) 查询 的 输出 撒 虑 ， 显 示 完 整 的 列 
在 图 4-4 的 输出 中 ， 我们 看 到 在 选中 列 中 的 对 和 象 构造 器 persoon_t() 和 和 它 的 各 个 成 分 一 
起 出 现 。 这 在 概念 上 与 图 4-3 的 Select* 的 查询 结果 截然 不 同 ， 在 后 边 的 例子 中 我 们 将 看 到 这 
种 从 - :个 对 每 中 检索 单个 对 象 值 的 能 力 如 何 提供 新 的 功能 。 
图 4-4 演 示 了 ORACLE 如 何 显示 列 对 象 和 和 行 对 象 : 


name_ +t “Delaney' ,Patrick","X")} 
Person tr0O23894455 ,name_tt'Sanchez’' ,Jose',F'},30) 


这 种 显示 格式 和 例 4.2.2 构 造 一 个 揪 人 teachers 表 的 列 对 每 name_t 的 形式 相似 。 
ORACLE 提 供 了 这 种 将 对 象 构造 器 用 于 从 属性 值 牛 成 对 象 和 显示 一 个 给 定 类 型 的 对 象 的 一 般 形 
式 ， 如 图 4-5 所 示 。 


typenametargument [{,argument...}]) 
图 4-5 ORACLE 对 象 者 造 器 的 一 般 形 式 


例 4.2.5 给 出 了 如 何 使 用 对 象 徇 造 器 的 另 一 个 例子 。 
例 4.2.5 对 Jose 上 . Sanchez 显 示 Pecrscon 上 对 银 的 所 有 部 分 ， 包 后 社会 保 障 导 和 千 齿 。 


select valuerp} from People p 
Where P-pname = name_ tt Samehez”， Jose’, "FF"’): 


注意 ,这 里 的 对 演 构 造 器 是 name_t {) 而 非 valuvet{}) 形 式 ，value() 仪 能 被 册 于 检索 一 
个 表 的 当前 行 ， 而 不 能 用 于 构造 一 个 新 的 对 象 。 果 

在 例 4.2.6 中 ， 我 们 举例 说 明 使 用 点 导 访 问 一 个 列 对 和 铬 的 一 个 属性 的 查询 ， 列 对 季 月 :J 导 不 
能 作为 一 个 列 限 定 。 
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例 4.2.6 发 现 姓氏 以 “Pat” 开 始 、 年 龄 大 于 和 的 所 有 人 的 姓名 和 年 龄 。 


sglect p.pname, Pp.age from people p 
where ppname.fname Tike ‘Pat%' and p.age > 0; 


和 前 面 的 例子 一 样 ， 在 查询 中 要 求 用 表 的 别名 p。 我 们 将 在 下 边 对 此 给 予 说 明 。 惠 


在 任意 的 ORACLE SQL 语句 中 ， 可 以 用 其 套 的 点 号 访问 一 个 对 象 的 属性 ， 该 对 象 又 是 另 
一 个 对 象 的 属性 …… 另 一 个 对 象 列 x 的 属性 ， 直 至 某 个 有 限 但 非常 大 的 层次 的 嵌 套 。 我 们 用 
x ,attrl 访 问 对 象 列 x 的 属性 attr1i; 若 attri 是 带 有 属性 attr2 的 一 个 对 象 ， 则 我 们 可 以 
用 x .attrl .attr2 访 问 属 性 attr2， 恢 次 淆 推 ， 

尽管 第 3 章 中 的 SQL 语句 不 要 求 对 某 个 列 引 用 使 用 限定 符 ， 访 问 对 象 属性 的 SQL 语句 却 有 
不 同 的 规则 。 正 式 的 情况 下 ，ORACLE 要 求 所 有 访问 属性 的 表达 式 均 用 别名 限定 ， 即 这 样 的 
表达 式 如 同 例 4.2.6 那 样 ， 必 须 以 一 个 表 别 名 《 而 非 表 名 ) 开始 ， 后边 跟着 带 点 号 的 属性 幅 套 
序列 。 非 正式 的 情况 下 ，ORACLE 似 乎 支持 例外 的 情况 ， 即 允许 一 个 对 象 春 (其 中 的 行为 对 
象 ) 的 顶层 属性 被 不 加 限定 地 使 用 。 例 如 ， 考 虑 对 顶层 属性 pname 和 fname 的 访问 ; 


select Pp.pname from people pp; -- table alias used, officially correct, works 


salect pname from people; 


规划 对 顶层 以 下 党 要 用 馈 套 的 点 号 的 属性 是 严格 实施 的 。 


-- notk a top Teével attribute: doesrn't work 


-- no table alias, tot officially correct, but works 


select pname. fname from pecple: 


select people,pname, fname from people: 


下 边 的 两 个 例子 说 明 ，Insert 和 Update 语 句 同 样 可 以 使 用 对 象 构造 器 为 新 行 指 定 值 ， 但 带 
有 相当 严格 的 限制 . 
例 4.2.7 建立 一 个 对 得 类 型 name 上 的 名 为 scientists 的 表 ， 并 为 Albert Einstein 在 表 


create tabte scientists of mame 十 ; 
insert into scientists values CE'Einstein’ , "pAlbert', ED).: 


由 于 我 们 可 以 用 对 象 构造 器 name_t'({'FEinstein',，，'Albert'，'FE'}) 生 成 一 个 
name_ + 对象， 这 似乎 意味 着 下 边 的 Insert 吾 钵 将 有 效 。 


insert into scientists name t("Einstefn’ ,Albert’,E'}: ** DOESNT WORK 

然而 ， 该 语句 却 是 无 效 的 一 个 简单 的 原因 是 该 语句 不 符合 图 3-22 的 Insert 语 句 的 一 般 形 
式 ， 该 形式 要 求 表 各 后 面 必须 跟随 一 个 VALUES 关 键 字 自 或 一 个 子 查询 . 然而， 这 种 将 整个 
scientists 行 对 象 用 一 个 对 象 构造 的 值 蔡 换 的 更 新 是 有 克 的 。 


update scientists 5 set s = name_t(t Eisenstein",. ‘Andrew','F') 


-- also dpesn't Work, since Must use alias 


where valuers} = Aame, ti"Einstein, ‘ATbert','F'»: 


我 们 可 以 使 用 VALUES 关 键 字 和 一 个 对 象 构 造 器 将 Einstein 姓名 对 象 插 人 People 中 。 


insert into people values (£123441998, naime t{'Einstein’, Albert’,E}, 100}: 


我 们 同样 可 以 将 在 people 中 发 现 的 所 有 name_+ 对 象 插 人 scientists 表 中 。 


insert into scientists select p.pPname from people p: | 


下 边 ， 我 们 将 看 到 ,一 个 空 值 同 样 可 以 被 赋予 一 个 对 象 。 
例 4.2.8 将 ssno 为 321341223，pname 利 age 为 空 值 的 行 到 people 中 。 我 们 可 以 以 两 种 


rr 
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方式 完成 插入 。 

insert into people valuyues {321341223, rull, null):; 

( 该 插入 等 价 于 下 边 的 语句) 

insert Tinte people (ssnoy values (3213d41223}: 

由 于 Insert 语 句 的 语法 不 支持 表 的 别名 ， 顶 层 属 性 (如 在 第 2 个 例子 中 的 ssno) 在 列表 中 饿 
不 加 限定 地 引用 。 然而 ，Update 语 句 却 允 许 表 的 别名 ,因此 需 使 用 属性 的 完全 限定 的 表达 式 。 

用 Ben Gould 替 换 上 一 个 播 人 行 中 值 为 空 的 姓名 属性 。 我 们 不 知道 它 的 mi 。 

update peopte p set p.pname = mame t{ "Gould', ‘Ben’, null) where ssno 一 321341223:; 

Update 语 句 可 用 于 替换 一 个 复杂 对 象 列 的 其 一 部 分 ， 例 如， 单个 的 两 层 属性 值 。 下 边 的 
语句 用 C 震 换 刚 插入 的 行 的 空 mi 值 。 


Update people p set p.phame .mi = ‘CGC’' where ssno = S321341223; 
我 们 曾 提 到 ， 可 以 使 用 行 对 象 构 造 器 以 一 个 Update 语 句 替 换 整 个 行 。 在 执行 更 新 时 ， 我 
们 其 至 可 以 修改 主键 ssno。 
update people p set p = person tt332341223, Name_tt "Gould , ‘Glen’, ‘A’}, 55) 
Where ssnt 一 321341223; | 


图 4-6 列 出 了 我 们 至 此 所 介绍 的 对 象 类 型 和 对 象 表 创 建 和 删除 的 一 般 形 式 。 所 有 属性 的 数 
据 类 型 均 在 Create Object Type 语句 中 描述 ， 唯 有 在 Create Object Type 请 句 中 命名 的 属性 古都 
些 被 指定 为 NOT NULE 或 包含 在 PRIMARY KEY 说 明 中 的 属性 。 


CREATE TYPE typename pS OBJECT 

tattrname datatype 于， attrname datatype ...}); 
CREATE TABLE tablename OF typename 

f [attrname MOT NULL] {, attrname NOT NULL ...} 


[。 PRIMARY KEY tattrname f.attrname ...}}]): 
DROP TYPE ty¥pename: 
DROP TABLE tablename: 





图 4-6 《迄今 为 止 涉 及 的 ) 创建 和 删除 对 象 类 型 和 对 象 表 的 ORACLE 语句 


REF 对 和 象 引用 的 定义 

出 现在 对 象 表 中 的 对 象 称 为 行 对 售 ， 而 在 表 的 列 中 出 现 的 对 象 ( 或 在 其 他 对 象 中 的 属性 ) 
称 汐 列 对 象 。ORACLE 为 每 个 行 对 象 ( 但 没有 列 对 象 ) 提供 一 个 唯一 标识 ， 称 为 对 人 象 标识 村 ， 
同时 ， 一 个 表 的 列 (或 属性 ) 可 被 定义 为 一 个 称 为 REF 的 内 部 的 数据 类 型 ， 允 许 它 “ 指 回 ” 
一 个 【可 能 不 同 的 ) 对 象 表 中 行 对 象 。 指 向 某 个 行 对 象 的 RERE 和 该 对 象 自 叶 被 认为 具有 不 同 
的 数据 类 型 。 与 行 对 象 不 同 ， 列 对 象 被 看 做 是 分 组 相关 属性 的 一 种 方便 的 形式 ， 甚 自 时 并 不 
重要 ; 它们 不 应 得 到 自己 的 REF。 

在 图 2-2 的 CAP 数 据 库 中 有 4 个 表 : customers、agents、products 和 orders。 在 例 
4.2.9 中 ， 我 们 重新 将 这 些 表 转换 为 对 象 表 并 用 REF 从 order 行 对 象 依 次 指 回 customer、 
agent 和 produect 行 对 象 。 我 们 将 看 到 我 们 可 以 使 用 REF 来 避免 orders 和 其 他 表 间 的 低 效 
率 的 连接 。 我 们 可 以 用 3 个 对 象 REF 来 代替 orders 表 中 的 cida、aid 和 pid 列 。 但 是 知 没 有 这 
些 列 ， 我 们 不 可 能 设置 REF 的 值 。 这 说 明 最 好 保存 cia、aia 和 pid 列 的 原来 的 伍 ， 而 仅 增加 
3 个 对 象 REF 列 。 和 前 边 一 样 ， 这 里 的 cida、aid 和 pia 是 它们 各 自 所 在 的 表 的 主键 。 
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例 4.2.9 ”对 顾客 、 人 代理 商 、 商 品 和 订单 使 用 村 象 表 生 成 CAP 数 据 库 ， 芷 每 个 表 中 保留 原 
来 的 列 ， 并 依次 增加 从 oraqers 对 象 表 中 的 每 个 订单 到 该 订单 涉及 到 的 customer、agent 利 


proauct 行 对 象 的 REF 。 
create type customer_t as object .3 -- attributes same as columns for customers 
create type agent t as object (,...): -- attributes same as columns for agents 
create type product +t as object ff.,.,.); -~-- attributes same as columns for products 


create type order t as object 
‘ 


rdno int, 

menth chart3d}, 

tid chartd}, 

引 1 二 chartd), 

pid chart3): 

qty int, 

dal1lars double precision., 

Ordcust ref custpmer +. - added coluinn points to customers row object 
ordagent ref agent_t, -- added column pol1nts to agents row object 
ordprod ref product t "* added cilumn points to proiducts row object 


); 
create table customers of customer t (primary key tcid}}; 
create table products of product t tprimary key tpid}}:; 
Credte Table gents of agent_t tprimary key (aid}y}: 
create table orders of order_t 
Le 

primary key 【Drdnoj， 

seope for ordcusty 1s customers. 

scope for rordagent}y 15 9ent5 ， 
veope for cordprod) 1 products 


}: | | 


由 于 order_t 属 性 ciqd， 每 个 orders 行 对 象 有 一 个 cid 列 (和 其 他 的 customers 
列 ) ; 像 这 样 的 列 经 常 被 用 作 外 码 ， 因 为 它 经 常 被 用 在 -个 连接 中 以 确定 与 ciq 主 键 对 应 的 
customers 行 对 象 。 每 个 orders 行 对 象 有 一 个 ordcust 列 ， 一 个 指向 有 具有 相同 cia 的 
customersiI 对 象 的 REF。 类 似 地 ， 每 个 corders 行 对 象 有 aigd 和 ordagent、pig 和 和 
ordprod 列 。( 当然 ， 这 里 我 们 假定 上 边 所 有 的 表 都 已 装载 ，Flordcust、ordagent 和 
ordproq REF 值 都 已 适当 地 设置 ， 其 过程 可 以 参考 本 节 的 最 后 一 小 节 “ 效 载 带 REF 的 表 ”。) 
出 瑶 在 例 4.2.9 中 orders 的 Create Table 语 名 中 的 SCOPE FOR 子 铝 用 于 确 使 新 定义 RER 的 
列 值 总 是 由 SCOPE 描 述 范 围 内 的 表 中 对 象 ; 当然 ， 在 SCOPE 中 描述 的 表 必 须 是 一 个 对 象 表 。 
这 个 范围 决定 了 给 REF 赋 值 的 内 部 格式 : 对 不 在 范围 内 的 表 的 REF5| 用 需 些 蝎 长 的 格式 。 如 果 
一 个 被 引用 的 对 象 被 删除 或 不 存在 ， 则 REEF 引 用 是 无 效 的 。 在 初始 时 ， 我 们 假定 对 REE3 引 用 总 
有 相应 对 象 隐 。 

我 们 可 以 在 一 个 REF 之 后 使 用 点 号 。 我 们 将 其 称 为 对 REE 的 间接 引用 。 正 边 给 出 了 - -个 检 
索 所 有 超过 200.00 美 元 的 订单 扎 和 订购 的 客户 名 的 查询 : 


select o.oordno, o.oordcust.cname from orders o where o.dollars > 2Z00.00: 


我 们 已 经 使 用 一 个 非常 简单 的 REF 语 句 来 代替 连接 查询 ， 其 结果 不 仅 使 查询 变 得 更加 简单 ， 
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而 县 使 cname 值 更 加 便于 访问 ( 至 少 在 这 种 情况 下 如 此 )。 以 下 是 关于 这 种 简化 的 更 多 例子 。 


例 4.2.10 ”和 和 例 3.3.4 一 样 ， 检 索 所 有 的 顾客 -代理 商务 对 (cname ，aname)， 其 中 ,顾客 
通过 该 代理 商 发 出 订单 。 

select distirnct o.oordcust ,cname, 0.0rdagent.aname from orders ¢; 

原来 例 3.3.4 的 查询 要 求 二 次 连接 。 国 

并 非 所 有 的 涉及 林 单 的 查询 都 如 此 简单 。 要 求 和 订单 自身 做 连接 的 查询 就 不 可 能 简化 ， 
如 下 例 所 示 。 

例 4.2.11 和 和 例 3.3.7 一 样 找 出 所 有 被 至 少 两 个 客户 订购 的 产品 的 pia 值 。 


sptect distinct xl,pid 
from orders Xl, orders Xe 
Where xl.pid = x2,Ppid and xi.ordctust < x2.0rdeust: 


集 该 查 交 中 ， 我 们 检测 所 引用 的 订单 的 ordcust 值 以 训 人 饮 出 现 重复 的 结果 例 3.7,6 给 出 
了 执行 该 查 疗 的 为 一 种 方式 。 国 

在 例 4.2,9 中 的 REF 人 渴 许 我 们 简化 基于 cigd 的 customers 和 orders 间 的 、 基 于 aiad 的 
agents 和 orders 间 的 和 基于 piqd 的 products 和 orders 间 的 连接 。 这 是 在 实际 中 常用 的 
连接 因此 是 有 价值 的 简化 。 在 一 些 情 况 下 ， 通 过 RBF 访问 比 通过 连接 访问 的 效率 更 高 ， 但 
是 ,我 们 只 有 了 解 查 询 计 划 的 前 提 下 才能 判定 何 时 会 更 有 效 。 现 在 我 们 可 以 说 通过 按 REF 处 
理 的 连接 的 方式 来 查询 orders 中 与 custorers，, agents 和 products 相 关 的 信息 比 直接 
通过 这 些 表 间 的 主键 、 外 键 的 连接 更 有 北 。 

ORACLE 提供 了 一 个 用 于 获得 出 现在 其 他 连接 的 SQL 语句 中 的 REF 对 象 值 的 REF( } 消 数 ， 
下 边 是 该 陋 数 的 一 个 例子 。 

例 4.2.12 和 和 例 3.4.12 一 样 ， 查 询 所 有 没有 遂 过 代理 商 a05 订 购 商 品 的 顾客 名。 


$ect ccname from customers ce 
where not exists {select * from orders xX 
where x.ordcust = refftcy and x.aid = as"): 


这 里 我 们 通过 使 用 REF 值 来 确定 客 让 以 避免 显 式 地 引用 cid。 我们 希望 这 比 根 据 cid 搜 索 
更 快 ， 但 是 这 只 有 在 对 该 例 中 使 用 的 查询 计划 有 所 了 解 的 情况 下 才能 确定 。 至 少 应 该 清楚 子 
查询 如 和 何 依 赖 十 外 部 的 Select 语 句 ， 这 是 一 个 相关 的 子 查 询 。 国 

在 3.5 节 的 FOR ALL 查 询 中 ， 我 们 看 到 了 由 于 REF 的 使 用 而 对 复杂 度 有 了 很 大 的 改进 。 这 
可 以 减少 由 标识 产生 的 混乱 ， 而 使 对 象 间 的 基本 连接 问题 变 的 更 加 清晰 。 

例 4.2.13 ”和 例 3.5.2 一 样 ， 取 得 所 有 通过 New York 的 代理 南 发 订单 的 顾客 的 cid 值 。 像 先 
前 一 样 ， 我 们 得 到 “找到 无 反例 存在 的 客户 c， 也 就 是 说 ， 对 于 顾客 c 找 不 到 - :个 居 作 任 New 
York 有 目 没 有 订单 x 将 a 与 ce 相连 ”。 这 里 我 们 可 以 将 一 个 相连 的 订单 刻 男 为 对 a 和 ec 的 引用 . 


Select .eid from customrs c where - select c if 


not extsts (select * from agents a -" there is no agent 
where a.city = New York’ and -- Tiving in N.Y. 
not exists (select * From orders 其 -- With ne order connecting 8 and ce 


Where Kordcust = reffte) and .ordagent = ref(a))): 
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到 目前 为 止 ， 我们 直到 的 查询 中 ， 我 们 假定 所 有 的 REF 值 列 均 非 突 且 引用 正确 的 对 象 表 
中 的 正确 的 行 。 SCOPE 子 名 保证 了 所 有 的 非 空 引用 在 创建 时 指向 正确 的 表 ， 此 和 外， 我 们 假定 
REF 值 在 创建 后 被 适 当地 设置 ， 但 是 ， 当 被 引用 的 表 中 的 行 被 删除 时 ， 连 接 到 这 些 行 的 REF 将 
变 成 挂 起 的 REF。 我 们 可 以 用 一 个 新 的 IS DANGLEING 谓 词 来 查询 这 种 异常 。 

例 4.2.14 取得 orders 中 挂 起 的 REF 的 般 客 的 cig 值 。 

Select ocid from orders 0 Where o.ordeust 1s dangling: 

类 似 地 ， 我 们 可 以 使 用 谓词 JS NULL 发 现 空 的 REF。 这 与 IS PANGLING 不 同 ， 因 为 一 个 
挂 起 引用 可 以 有 一 个 不 正确 的 值 。 发 更 这 种 异常 的 另 一 种 方式 是 使 用 orders .ciqd 列 作为 我 
们 将 要 决定 的 合适 的 cordcust 值 。 


seleEct od.cid from orders & where oOo.ordcust <» 
tselect reftcy from customers c where c.cid = .cidy: 


挂 起 的 REF 是 非 空 而 无 用 和 的。 若 o .ordcust 是 空 的 或 挂 起 的 ， 则 o .ordcust .cname 像 
被 引用 的 其 他 不 存在 的 customers 表 行 的 属性 一 样 是 空 的。 这 样 一 个 坏 的 引用 不 会 像 C 语 言 
中 的 坏 的 指针 一 样 地 死亡 ， 因为 我 们 可 以 问 接 引用 它 而 不 导致 使 程序 终止 的 异常 。 然 而 ， 这 
可 能 与 检索 一 个 不 期 望 的 空 值 相 混 淆 。 

一 个 对 象 类 型 不 能 吝 套 地 包含 一 个 与 其 类 型 相同 的 成 分 ,但 可 以 包含 :个 对 具有 同样 类 
型 的 其 他 对 象 的 引用 。 考 虑 下 边 的 police-officers 直 的 定义 ， 其 中 假定 和 拇 个 警官 有 一 个 
搭档 。 

例 4.2.15 ”创建 一 个 带 有 通过 对 另 一 警官 对 象 的 REF 表 示 的 搭档 属性 的 警官 类 型 。 为 这 些 
警官 创建 一 个 对 象 表 。 


create type police officer t as bject 
t 


pol persor person_t. 
badge_number integqer, 
partner ref police officer t 


有 
create table police officers ef police_officer_t 


( 
primary key Chadge_number}, 
stope Tor tpartner}) is police officers 


例 4.2.16 检索 其 搭档 的 年 龄 超过 60 岁 的 所 有 警官 的 姓 。 


select pol_person. name From pofice_officers p 
where p.partner ,pol_ person.age 2 ho: 图 


ORACLE 提供 了 -- 个 DEREE 画 数 允 许 SQL 请 法 检索 一 个 由 给 定 的 REF 引 用 的 整个 对 象 . 
下 边 是 一 个 检索 所 有 警官 及 其 搭档 的 信息 的 查询 。 


select valuetp), dereftp.partner} from police_officers p; 


上 上边 查 询 中 的 最 后 一 个 value {p} 属性 是 partner， 一 个 REF 值 ， 其 结果 将 以 15 进 制 数 
的 方式 打印 出 来 。 
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(1) REF 依 赖 

一 个 表 集 合 可 以 具有 一 个 用 REF 志 示 的 复杂 关系 集 。 例 如 ， 懂 员 具 石 部 门 ， 部 门 具 有 经 
理 ， 丈 理 又 是 一 个 雇员 。 我 们 可 以 在 empLoyees 表 中 创建 一 个 REF 列 指向 aebartments 行 
对 得 ,以 及 一 个 departments 表 中 的 REF 列 指 同 employees 表 中 的 manager employee 列 。 
这 里 涉及 到 回路 的 依赖 {部 门 有 -个 指向 雇员 的 REFE， 而 且 麻 员 有 : -个 指向 部 门 的 REF)， 似 平 
不 可 能 创建 -- 个 类 型 ， 内 为 每 个 Create Typs 语 句 指 向 其 他 类 型 。 然 而 ，ORACLE 支 持 椒 完全 
类 型 定义 技术 .你 可 以 用 下 面 的 语句 部 分 地 创建 empl1oyee_t 类 型 [为 了 输出 到 SQL*Plus 在 人 句 


必用 / 代 赫 分 号 ): 
create type employee t 
pF -= hote no semicolon Used 1h Partial create 


然后 你 可 以 用 一 个 指向 employee_t 的 REF 完 整地 创建 4epartment_t， 并 用 一 个 指向 
department_t 的 REF 最 终 创 建 完整 的 emp1loyee_t 类 型 。 当 我 们 试图 删除 男 一 个 这 样 相互 
引用 的 表 或 类 型 集合 时 ， 我 们 必须 在 删除 类 型 之 前 删 队 表 . 但 是 由 于 类 型 间 存 在 相互 引用 ， 
当 我 们 试图 删除 两 个 类 型 的 时 候 ， 我 们 将 发 现 有 铺 误 返回 。 为 了 避免 这 种 情形 的 发 生 ， 不 是 

DROP TYPE tyYpename ; 
简单 地 使 用 ; 

DROP TYPE typename FORCE; 
我 们 必须 对 在 多 个 表 间 的 REF 环 中 涉及 的 所 有 类 型 使 用 : 

(2) 装载 带 REF 的 表 

我 们 需要 单独 考虑 装载 带 REF 列 的 表 。 在 ordaers 表 的 例子 中 、REF 列 完全 由 orders 表 
中 的 外 码 cid，aid 或 pid 列 值 快 定 ， 因 为 这 些 列 是 亡 们 上 自身 表 的 主键 。 我 们 可 以 从 用 同样 的 
数据 使 用 同样 的 装载 过 程 开 始 ， 像 附录 A 中 描 述 的 关系 情形 那样 。 然 后 ， 我 们 可 以 使 用 如 下 一 
个 Update 诸 名 设 定 所 有 的 引用 。 

例 4.2.17 “用 带 有 对 custoemers、agenmnts 和 Preoauctgs 的 正确 的 引用 蔡 换 cordaers 中 的 
任意 当前 的 REF 值 。 


Updte Tr Dt 
ordecust = tselect reffcy from customers gE 网 hr tc.cid = ocid}, 


ordagent = tselect refea) from agents a where a.aid = 0.31d), 
ordprod = {select reftp} from products p Where ppid = o.pid}:; 


这 早 我 们 使 用 一 个 标量 子 查 询 来 检索 REF 值 ，ORACLE 人 允许 的 并 且 授 用 的 Update 诸 句 形 
式 ， 如 图 3-23 所 未。 图 

例 4.2.18 从 People 表 中 选 搓 -- 个 ssnc 为 033224445， 徽 章 呈 为 1000 的 警官 插 和 人 到 例 
4.2.15 的 表 中 ， 新 警官 的 搭档 是 另 一 个 在 police_officers 中 已 经 存在 的 徽章 号 为 990 的 警 
官 ， 因 此 ， 新 警官 的 搭档 可 以 被 立即 确定 。 


insert into police._ officers 
select valuetp}, 1000, reftp0} from people p. police officers po 
Where p.55no = 039224445 ard pO.badge number 一 990; 
update police officers set p.partner ~ (select reftp0) from police_otficers po 
where pO.badge number = 1000) Where hadge_number 一 990: 


在 上 边 的 Insert 语 名 中， 我 们 使 用 一 个 子 查询 从 pecple 中 排出 正确 的 行 对 象 并 且 使 右边 


136 灯 据 晨 上 原理、 编程 与 性 能 


的 REF 指 向 po1ice_officers。 这 里 需要 一 个 Update 诸 句 来 设 定 badge_number 为 990 的 
警官 的 REF 值 。 国 


4.2.2 INFORMIX 中 的 对 象 行 类 型 


INFORMIX 行 类 型 与 我 们 在 ORACLE 中 讨论 的 对 象 类 型 密切 相关 。INEORMIX 行 关 型 由 
Create Row Typel 行 光 型 创建 ) 语 名 定义 ， 如 例 4.2.19 所 示 。 注 意 在 DRACLE 中 被 称 为 属性 的 成 
分 在 INFORMIX 中 被 称 为 字段 。 


例 4.2.19 ”创建 一 个 带 有 两 个 类 型 为 varchar(30} 的 字段 1nams 和 fname 和 一 个 char(1) 字 彼 
mi 的 行 对 蒙 。 该 行 类 型 与 ORACLE 中 的 例 4.2.1 相 似 ; 
Create Pow type name_t 
te 
1name varchart do, 
fname varchér ty, 


mi chartly 


}; 国 


现在， 我 们 可 以 将 行 类 型 实例 称 为 对 象 或 行 对 象 ， 因 为 这 些 对 象 与 ORACLE 中 的 行 对 象 
相 化 ， 问 时 它们 也 满足 对 象 的 某 些 特性 。 便 如 ， 它 们 具有 一 个 用 户 定义 类 型 ， 该 用 户 和 定义 类 
型 共有 值 的 内 部 成 员 结 构 ， 介 在 许多 上 万 面 像 内 部 类 型 。 然 而 INFORMIX 不 司 用 对 象 这 - -术语 ， 
而 将 它们 称 汐 行 类 型 的 行 或 实例 。 

像 ORACLE 一 样 ， 例 4.2.19 中 的 name_t 行 (对 象 ) 类 型 定义 并 不 创建 该 类 型 的 任何 实例。 为 
了 创建 这 样 的 实例 ， 我 们 需要 定义 一 个 其 行 或 列 可 以 包含 这 样 的 实例 的 表 ， 邵 后边 的 例 4.2.21 
所 未。 

一 个 行 类 型 可 以 被 用 来 定义 另 -- 个 行 类 型 的 字段 。 在 例 4,2.20 中 ， 我 们 定义 了 一 个 
INFORMIX 行 类 型 person_t， 描述 一 个 带 有 称 为 pname 的 name_t 字 有 段 {位 记 为 
person_name ) 和 其 他 字段 。 例 4.2.20 与 ORACLE 的 例 4.2.3 相 似 、 


例 4.2.20 ”创建 一 个 分 别 包 含 人 的 社会 保障 号 、 姓 名 和 年 龄 的 person_t 行 类 型 ， 在 此 之 
前 先 删除 已 经 存在 的 同名 行 类 型 。 
drop row type PerSof restrict:; 


create row type Person_t 
t 


写 训 站 int, 
pname name_t. 
下 中 所 int 


] ; 
在 所 有 的 INEORMIX Drop Row Type 语句 中 必须 有 “可 选 的 ”RESTRICT 关 键 字 、 尽 管 在 
所 有 的 Drop Row Type 语句 仅 要 求 一 个 选项 显得 有 点 奇怪 ， 于 边 将 对 此 进行 说 明 。 国 


由 于 person_t 的 定义 中 使 用 了 J 了 人 name_t， 我 们 说 person_t 人 依赖 于 name_t。 像 
ORACLE 中 一 样 ， 我们 不 能 在 berson_t 存 在 时 删除 name._t 行 类 型 。 为 了 删除 这 两 个 行 类 
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型 我们 必须 按 “ 引 用 者 优先 ”的 次 序 来 删除 它们 : 先 删 除 person_t， 再 删除 name_t。 
拓 型 和 表 间 机 所 引用 的 信息 可 以 从 数据 库 系 统 中 的 目录 表 中 得 到 。 见 第 7 章 的 最 后 一 节 。 

在 INFORMIX 中 ， 若 - :个 表 中 的 行 是 已 命名 的 行 类 型 ， 则 该 表 被 称 为 类 型 表 。 一 个 
INFORMIX 拓 型 表 对 应 一 个 ORACLE 对 象 表 。 例 4.2.21 创 建 了 一 个 与 ORACLE 中 的 例 4.2.4 相 
似 的 带 有 person_t 类 型 行 的 表 。 

例 4.2.21 创建 -个 称 为 people 的 person_t 对 象 的 表 ， 使 用 社会 保障 号 作 汶 主键 。 


create table people of type person_t 


{ 
primary key Lssno) 


1; 加 


后 边 我 们 将 倒 4.2.21 中 的 CREATE TABLE table name OF TYPE typename ... 诸 句 
称 为 Create Typed Jable( 类 型 表 创 建 ) 语 句 ， 将 用 列 名 列表 创建 关系 表 的 则 语法 称 为 Create 
Relationdl Table( 关 系 表 创建 ) 语 锯 。 当 我 们 对 此 不 如 区 别 时 ， 我 们 将 - -者 孝 称 为 Create Table( 表 创 
建 ) 语 句 。 创 建 和 删除 行 类 型 和 类 型 表 的 一 般 形 式 厚 图 4-10。 特 草地 ， 你 将 注意 到 INFORMIX 不 
像 ORACLE， 不 在 Create Type 语句 而 是 在 Create Typed Table 语 句 中 定义 NOT NULL 字 段 。 

与 在 ORACLE 对 象 表 中 处 理 顶 层 属性 的 方式 相对 应 ， 用 寺 定 义 类 型 表 的 行 类 型 的 项 层 字 
段 将 像 表 中 的 列 一 样 起 人 作用， 这样 ， 例 4.2.21 中 的 peopTle 表 将 像 图 4-2 描 述 的 模型 那样 具有 
ssno，pname 和 age 列 。 类 型 表 可 以 恰 看 做 是 带 有 一 个 行 类 型 对 象 询 的 表 或 像 ORACLE 中 带 
有 命名 列 序列 的 表 。 这 样 ， 我 们 可 以 使 用 顶层 字段 名 ssne， pname 和 age 来 查询 INFORMIX 
类 型 表 ， 如 下 的 Select 语 句 可 以 完成 这 样 的 功能 : 


splect age from people Where ssno = 123550123: 
select pname from people where age > oo: 


或 省 使 用 等 价 的 限定 列 引 用 


select 日 -Pname 于 From people 9 where q.age > 29; 

注意 ， 在 INFORMIX SeJect 庄 句 中 不 必 像 ORACLE 中 那样 使 用 列 的 限定 别名 。 这 里 的 
name_t 对 象 将 按 row{'Sanchez','Jose','F') 的 格式 被 打印 出 来 。 下 面 我 们 会 对 此 迟 
进 - 步 的 讨论 。 选 择 列表 的 * 格 式 : 

select * fraom pecple where age 2 25: 

将 显示 所 有 的 列 。 和 ORACLE 的 图 4-3 相 比 ， 在 图 4-7 中 的 列 对 象 pname 的 显示 村 / 式 将 有 
所 不 同 ， 特 别 居 用 row {) 构造 此 的 形式 代 兰 name._t {} 对象 构造 器 的 形式 的 用 法 。 


55N0 pname ag6 


证 与 总 安庆 1 和 4 rowt Detarey', Patrick".'X+) #9 
ie hb rowt Sanchez' , ‘Jose',F',? 30 





图 4-7 INFORMIX SELECT * 查 商 和 输出， 显示 所 有 的 列 


但 ”在 SQL-99 标 准 中 除 RESTRICT 以 外 还 描 访 了 另 一 个 称 为 CASCADE 的 选项 ， 用 米 删 除 一 个 用 户 定义 类 型 及 所 
石 依赖 于 它 的 类 融 。RESTRICT 和 CaASCADE 选 项 中 的 一 个 必须 在 所 有 和 这样 的 Preop 语 和 铝 中 摘 述 ， 也 是 
RESTRICT 是 $0L-99 核 心 标 准 的 一 部 分 ， 而 CASCADE 不 是 ， 因 此 INFORMIX 仅 使 用 RESTRICT 一 个 选项 是 
合理 的 。DRACLE 提 供 了 不 使 用 RESTRICT 的 非 标准 的 能 方 , 并 提供 了 一 个 不 同 于 CASCADE 的 FORCE 选 项 。 
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为 了 显示 “整个 ” 行 对 象 〈 而 非 行 对 象 中 列 的 集合 )， 我 们 可 以 使 用 表 的 列 名 自身 作为 选 
择 列 表 中 的 唯一 元 素 。 考 虑 如 下 查询 和 图 4-8 中 的 显示 格式 【在 ORACLE 中 我 们 需要 在 例 4.2.5 
的 选择 列表 中 使 用 VALUE(p) )。 


select p from people p where age > 29; 


Pp 


rowt245892134 PORT Delaney', Patrick','X'},9) 
row{ D23B94455, rowt Sanchez' , ‘Jose’,.F’ yy,40) 





图 4-8 INFORMIX SELECT table alias 沁 询 的 输出 形式 ， 显 示 全 部 的 行 对 象 


行 类 型 对 和 象 可 以 使 用 行 构造 器 ROW{ ) 构 造 ， 上 骨 转 换 成 适当 的 行 类 型 。 图 4-9 给 出 了 类 型 
转换 表达 式 CAST(...) 的 语法 及 其 使 用 方式 【注意 在 ORACLE 的 例 4.2.5 和 和 例 4.2.8 中 我 们 使 用 形 
加 mame tt. ..) 和 Perscon tf .1 的 对 象 构造 器 来 实现 同样 的 功能 









ROWLexpression [. expressicon...};. 
CASTIROWIexpression {f. expression...]) AS rowtype) 





图 4-9 INFORMIX 非 类 型 和 类 型 行 对 象 的 一 般 形 式 


casttrowt'Delanery' . Patrick', XxX" ds Mame_ 十) 
casttronmt O23894455 ,casttrowt Sanchez'’, Jose” ,FY as name_t),. 30) as person t) 


例 4.2.22 对 Jose Sanchez 显 示 整 个 person 对象 ， 并 为 其 姓名 使 用 name 上 对象 。 


select Pp from people p 
where Pp.Ppnhame = Casttrowl Sanchez', ‘Jose ,FT as Name_ +); 


这 里 有 一 种 将 INFORMIX 的 ROW( ) 消 数 表 达 式 转换 为 适当 命名 类 型 的 快捷 方式 ， 
row_expression: :typename。 这 样 ， 我 们 可 以 将 先前 的 Select 语 全 遇 为 : 

splect valuetp}y from pesple p 

where p.pname = rowt'SAanchez’, Jose’, FF):: name t; 四 

像 ORACLE 中 访问 属性 中 的 属性 一 样 ，INFORMIX 中 的 点 号 可 用 于 访问 字段 中 的 字段 ， 
二 者 唯一 的 差别 在 于 INFORMIX 中 不 必 在 这 些 表 达 式 中 使 用 表 限 定 符 ;， 如 果 在 Select 语 句 中 仅 
出 现 一 个 表 ， 则 我 们 可 以 选择 使 用 列 .字段 ， 别 名 . 列 或 表 . 列 . 字段 的 方式 来 访问 列 中 的 字段 。 

例 4.2.23 找 出 名 字 以 “Pat” 开 始 、 年 龄 超过 50 岁 的 所 有 人 的 姓名 和 年 龄 。 


select pname. age from people 
where pname.fname like "Pat%' and age > SO0; 


这 里 的 pname 是 行 对 得 的 顶层 字段 ，pname. fname 是 pname 的 fname 字 段 。 注 意 这 种 
形式 不 能 用 于 ORACLE 中 ， 因 为 这 里 没有 表 的 别名 ( 参见 例 4.2.6 )。 思 

播 人 和 更 新 也 可 以 使 用 行 构造 器 。 父 ORACLE 一 样 ，INFORMIX 中 对 象 也 可 以 为 室 ， 因 
为 空 值 是 一 个 受过 全 面 考验 的 数据 项 值 。 

例 4.2.24  ” 先 将 Albert Einstein 的 行 对 象 插 人 到 people 表 中 ， 该 对 象 的 社会 保障 叶 为 
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123441998， 年 龄 为 100。 然 后 搬 人 一 个 社会 保障 导 有 塌 义 而 pname 和 age 为 空 的 对 象 。 


insert inte peoplée values (i23441998, cast{rowt'Einstein', Albert, 'E) as name_t}, 100) 
insert into people values (321341223, null, null?: 


(或 者 使 用 等 价 的 方式 ) 


insert into people tssnoy values (321341224), 


在 最 后 一 个 插入 的 行 中 将 空 名 字 替 换 为 “Ben Gould”， 


update people set phname = CAStErowt GBSU1S “Ben', nully) as name_t} where ssno = 321341224; 


用 “c” 和 替换 空中 间 和 名 ， 保 留 已 指定 的 名 字 的 其 余部 分 。 


update people set pname = cast{rowtpname. lname, pname. fname. “CY as name t) 


| Where ssno = 32134]224.; 


这 时 的 行 构造 带 ROW( ) 从 非常 量 表达 式 (pname . 1name 和 pname . fname) 构 造 一 个 行 。 
现存 ， 我 们 生成 一 个 name_t 行 类 型 表 scientists 并 将 people 中 的 名 字 搬 和信 其中。 
”create table scientists of type name_t: 


insert nte seientists 
select pname.fname, pname. minitial, phame .iname from people: 图 


图 4-10 给 出 了 创建 和 删除 行 类 型 和 类 型 表 的 一 般 形式 。 

图 4-10 还 给 出 了 Create Typed Table 语 句 的 -- 般 形式 (创建 关系 表 语 句 的 形式 已 在 图 3-2 中 
给 出 ， 由 十 行 类 型 是 受过 全 而 考验 的 类 型 ， 所 以 我 们 同样 可 以 用 行 类 型 列 创 建 关 系 表 )。 一 个 
类 型 表 的 所 有 列 殉 建立 在 Create Table 语 句 中 定义 的 字段 的 基础 上 ， 若 合适 的 话 ， 可 以 带 有 
NOT NULL 说 明 ， 而 Create Typed Table 计 名 的 括号 中 的 PRIMARY KEY 说 明 是 唯一 的 可 选项 。 
注意 ，ORACTF 将 NOT NULT. 描 述 放 在 Create Dbjeet Table 语 句 而 非 Create Type 语句 中 。Drop 
Tabje 说 明 不 会 产生 例外 ， 但 Drop Row Type 需 要 在 末端 使 用 RESTRICT 子 句 。 


CREATE ROW TYPE rowtype 
{fieldname datatype [NOT NULL]L, fieldname datatype [NOT NULL] .-.1}}; 


DROP ROW TYPE rowtype RESTRICT:; 


CREATE TABLE tablename OF TYPE rowtype 
{ [ PRIMARY KEY tcolumn {eolumn .7}]}: 
CROP TABLE tablename: 
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1. INFORMIX 中 缺乏 REF 引 用 
当前 的 INFORMIX 版 本 与 ORACLE 的 -一 个 重要 不 同 在 于 缺乏 REF。 将 来 的 INFORMIX 版 


本 可 能 会 加 入 REF。 

2. TNFORMIX 中 的 类 型 悉 承 

INFORMIX 具 有 一 种 ORACLE 不 具备 的 能 力 ， 妈 类 型 旦 次 中 的 类 型 继承 。 如 果 我 们 需要 用 创建 -一 
个 新 的 anpLoyee 类 型 作为 person 尖 型 的 了 类 型 的 方式 来 定义 层次 的 思想 ， 其 中 的 子 类 型 继承 了 父 关 
型 中 的 数据 项 和 方法 ， 并 将 其 中 的 --- 部 分 作为 自己 的 数据 项 和 方法 。 回 兢 一 下 persormn_t 类 型 的 定义 : 


create row type person_t 
t 
总 马帮 总 Int, 
pname name_t, 


中 已 int 


' mr 
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我 们 可 以 定义 一 个 各 为 employee_t 的 子 类 型 如 下 ; 


create type employvee_t 
t 


已 jd in ， 
salary double precision, 
mayr1d int 
1 
制 中 条 关 店 Person t; -- sarys employee 4 is subtype of person t 


employee_t 类 型 前 硕 层 字段 现在 将 由 一 个 已 在 类 型 和 了 于 类 型 定义 中 命名 的 字段 的 联合 构成 : 
eiqd, salary, mgrid,. ssno, pname 和 age, -个 称 为 manoer_t 的 新 类 型 可 以 被 定义 为 
employee tt 类 型 的 子 类 型 . 


create type Manager.t 
[ 
budget doruble prerision, 
groupname yar -- Mame of group managed 


1 
under employee_t:; 


manager_t 类 井 对 和 象 继承 了 为 employee_t 定 义 的 所 有 字段 。 现 在 我 们 可 以 直接 创建 一 个 包 
合 像 manager_t 那 样 的 子 类 型 对 象 的 类 型 表 。 


create table managers of type manager 七 ; 
但 是 ， 为 了 获得 实现 继 淮 的 某 些 行为 ， 我们 需 从 一 个 最 高 层 类 型 表 开 始 定 义 于 表 ; 
rreate table people of type perscn_t; 


create table employees of type employee_t 
under people: -- employees table is subtable of people 


create table managers of type manager_t 


under employees: 
现在 ， 我 们 可 以 看 到 有 具有 表 继 承 能 力 的 SQL 行为 的 一 些 重要 方面 是 : 当 一 个 行 锌 搬 人 到 
”imanagers 表 中 时 ， 它 也 将 自动 成 为 employees 表 中 的 一 行 。 因此 查询 


select pname.fname, pname. 1name, eid from employees 


-- managers table is subtable of employees 


where salary > 65500001: 
将 不 仅 只 从 已 在 employees 志 中 捅 人 的 限定 雇员 检索 信息 ， 而 且 将 其 在 managers 表 中 插 人 的 限 
定 雇员 检索 信息 。 同 时 ，managetrs 表 是 一 个 独立 的 实体 ， 因 此 ， 行 我 们 写 查 询 
select pname, fname, pname. Iname, eid from managers 


where salary > 50000: 
出 我 们 将 只 检索 到 已 插 和 人 managers 中 的 行 。 最 后 ， 如 我 们 在 上 边 的 查 元 内 想 检索 那些 不 是 经 
理 的 雇员 ， 则 可 以 将 查询 蛋 写 为 : 


select pname.fname, pname.1name,. eid from only (employees) 


where saljary > OUON.; 


这 种 方式 标志 着 创建 一 个 单独 的 manager 类 型 的 manager 表 与 将 其 创建 为 employees 表 的 于 表 的 差异 。 
4.2.3 对 象 和 表 小 结 
我 们 已 经 介 织 了 旭 何 创建 对 象 ( 行 ) 类 型 和 包含 这 些 类 型 的 对 象 的 表 。 在 两 个 主要 的 数 
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据 库 产品 中 ， 这 些 对 和 象 可 以 作为 行 位 也 可 以 作为 列 值 。 除了 一 些 关 键 字 和 术语 的 不 同 久 ， 它 
们 是非 常 相似 的 . 

(1) ORACLE 和 INFORMIX 对 象 闻 的 相似 性 

两 个 产品 都 具备 以 下 特征 ， 

* 人 允许 程序 员 在 数据 库 类 型 之 外 建立 复杂 的 复合 对 象 { 行 ) 奖 型 。 

“= 多 许 用 户 提 供 新 的 对 象 数 据 类 型 ， 如 用 十 普通 的 表 的 列 的 数据 类 型 。 

* 人 多 这 对 象 虞 套 ， 

= 在 查 调 中 使 用 点 号 米 访 问 属 性 ， 并 介 许 点 号 多 重 馈 套 。 

* 允许 对 象 填 满 表 的 一 整 行 ， 在 这 种 情况 下 允许 顶层 属性 作为 表 的 列 使 用 - 

* 不 立 持 对 象 数据 的 封装 ( 即 数据 未 对 外 部 视图 隐藏 ， 见 下 边 “面向 对 象 ” 部 分 的 解释 }, 

(2) ORACLE 和 INFORMIX 对 象 间 的 差别 

* ORACLE 提 供 使 用 REF 的 能 力 ， 而 INFORMIX 没 有 . 

* INFORMIX 提 供 类 型 层次 和 继 床 功能 ， 而 ORACLE 没有 。 

面向 对 象 

将 对 象 模 型 引入 数 据 库 类 型 系统 的 一 个 主要 的 日 的 是 希望 支持 面向 对 象 的 编程 语言 ( 如 
Java 和 C++ ) 的 概念 ， 1989 和 个 ，6 位 在 该 领域 颇 有 名 望 的 专业 人 十 起 莫 卫 份 题 为 “ 面 回 对 和 象 
的 数据 库 系 统 家 言 ”的 论文 。 该 论文 试图 将 面向 对 象 数据 库 系 统 的 各 种 特性 加 以 优化 (参见 
推荐 读物 [11 )。 该 宣言 烈 出 了 曾 向 对 象 数据 库 系 统 必 备 的 13 条 特征 〔 或 称 为 “ 金 规 玉 律 ”). 
面向 关系 数据 库 系 统 只 采用 了 其 中 的 部分。 这 里 我 们 列 册 DRDPBMS 的 一 些 相 关 特 性 。 

在 面向 对 得 术语 中 ， 对 入 是 数据 结构 和 作用 于 这 些 数据 结构 的 痕 数 (在 ORSQL 中 称 为 用 
户 定义 函数 ) 概念 的 组 合 。 一 个 涉 太 对 象 的 用 户 定 义 函 数 如 果 是 该 对 象 定义 中 隐 和 会 的 部 分 ， 
则 了 岂 称 为 对 象 的 方法 。 在 面向 对 象 术语 中 ， 如 果 用 户 不 能 通过 除 对 象 提 供 的 方法 以 外 的 方式 
沪 问 对 象 中 的 数据 ， 则 该 对 象 被 称 为 是 封装 了 数据 和 方法 。 然 而 ，ORSQL 对 锭 不 交 持 真正 的 
封装 ， 因 为 方法 电 是 访问 数据 的 一 种 方式 : 自 接 用 SQL 查 询 和 更 新 数据 也 是 人 允许 的 {也 可 以 说 
个 支持 任意 SQL 访 问 的 封装 违背 了 数据 库 查 询 语 言 的 目标 })。 

带 有 特定 的 结构 和 方法 集合 的 对 象 在 OODBS 中 被 称 为 属于 某 个 OODBS 中 的 对 象 关 (对 
象 属于 一 个 类 就 像 编程 语言 中 的 变量 被 声明 属于 - -个 给 定 的 类 型 )，ORDRBMS 优 先 使 用 类 型 
这 一 术语 而 非 OODBS 术语 类 ， 

最 后 ,OOPBS 模 型 允许 创建 新 类 来 扩展 已 有 的 类 的 描述 ， 这 被 称 为 类 型 层次 ， 这 样 的 新 
子 类 型 被 称 为 继承 了 它 锌 定义 的 类 型 的 数据 和 方法 ，。 


面 问 对 象 特 入 ORACLE 对 象 类 型 。 INFORMIX 行 类 型 SQL-99 用 户 定义 类 型 
封装 不 权 持 不 支持 不 区 持 


用 户 定义 函数 支持 ,包括 方法 支持 支持 , 包括 方法 
对 象 引 用 支持 计划 文 持 支持 
继承 不 支持 多 村 支持 





正如 我 们 所 多 到 的 那样 ，INFORMIX 允 许 行 类 型 在 继 卫 层次 创建 。 一 个 经 理 是 -个 审 丰 
额外 信息 的 座 员 ， manager_t 行 类 型 的 定义 只 需要 电 式 地 列 出 这 些 额外 的 字段 如 上 unaer 
emplLovee ct 下 的 短语 。INFORMIX 版 本 9.2 尚 不 立 持 对 象 引 用 即 及 EF ， 但 计划 在 版 本 9.3 中 
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支持 它 。 

正如 将 在 4.4 节 介绍 的 那样 ，ORACLE 允 许 为 对 象 类 型 定义 方法 函数 ，INFORMIX 中 有 不 
爱 限 于 单个 对 象 或 对 象 层次 的 用 户 和 定义 图 数 ， 该 函数 具 丰 方法 -- 样 的 功能 、ORACLE 人 允许 .一 
个 行 对 象 被 - .个 来 自 其 他 对 象 属性 或 表 列 的 RER( 对 象 引 用 ， 其 他 数据 类 型 ) 指 向 该 行 对 象 。 

新 的 SQL-99 标 准 有 具有 和 ORACLE 对 象 类 型 或 INFORMIX 行 类 型 相似 的 用 户 定 头 类 型 
LUDT )。 然而 ， 在 SQL-99 的 基本 核心 中 没有 包括 该 部 分 。UDT 具 有 像 ORACLE 的 方法 和 引 
用 及 像 INFORMIX 的 继承 功能 ,但 像 这 两 种 产品 一 样 没 有 封装 的 特性 。 缺 乏 封 装 可 能 使 标准 
体 不 能 将 他 们 称 为 对 象 ， 并 终止 于 中 性 的 无 色彩 的 名 字 用 户 定义 类 型 。 

尺 管 ORACLE 不 支持 对 象 继承 并 HINFORMIX 版 本 9.2 不 支持 对 象 方法 ， 两 者 都 不 会 对 一 - 
般 的 应 用 构成 障碍 。 


4.3 汇集 类 型 


汇集 类 型 允许 我 们 在 一 个 行 的 革 一列 中 放 和 人 多 个 值 ( 值 的 汇集 }， 这 显然 违反 丁 关 系 规则 
1， 该 规则 不 允许 多 值 属性 。 人 和 例如， 汇集 类 型 允许 我 们 表示 EMPLOYEES 表 -- 个 列 中 麻 员 的 家 
属 集 ， 如 图 4-11 ( 重复 第 2 章 的 图 2-3 ) 所 示 。 


TT 












ename position | dependents | 


Michacl | 1 


Andrews, Dravid Superintendent | David M. .| ML | David M. .| 


Andrew 长 . 
e003 | [ones, Frankliin 


Mark Wi. 
图 4-11 带 移 值 qaepenaents 属 性 的 HHPLOYEES 专 


[oulsa At . 
由 于 在 和 不同 的 数据 库 产 品 对 聚集 类 型 的 处 理 并 不 完全 一 致 。 我 们 将 在 4.3.1 节 中 介绍 
ORACLE 的 谋 套 表 和 数组 ， 在 4.3.2 节 中 介绍 INFORMIX 的 集合 、 列 表 和 和 多重 集 ， 然 后 在 4.3.3 
节 中 对 两 者 进行 一 般 讨 论 性 总 结 。 


4.3.1 OAACLE 中 的 汇集 类 型 


DRACLE 中 有 两 种 汇集 类 型 表 类 型 和 数组 类 型 。 每 个 汇集 类 型 描述 包含 所 有 机 同类 型 
的 项 ， 即 元 素 类 型 。 一 个 元 素 类 型 可 以 是 内 部 类 型 或 对 象 类 型 ， 但 ORACLE 中 的 元 素 类 型 不 
能 为 汇集 类 型 。 汇集 类 型 是 数据 库 系 统 中 的 成 熟 的 数据 关 型 ， 经 过 适当 的 转换 ， 可 以 在 查询 
中 解释 为 表 。 我 们 先 介 绍 表 类 型 ， 再 说 明 数 组 类 型 。 这 里 针对 ORACLE 8.1.5 版 本 或 更 高 版 本 
进行 介绍 ，OQRACLE 8.0 支 持 汇 集 类 型 ， 但 从 8.0 到 8.1.5 版 本 在 语法 上 有 较 太 的 变动 ， 这 里 列 
举 的 一 些 查询 在 8.0 版 本 中 将 不 能 正常 工作 。 

1. 表 类 型 和 谱 套 表 

我 们 定义 可 被 用 以 实现 多 值 属性 的 表 类 型 。 


例 4.3.1 创建 一 个 名 为 dependents_t 的 表 类 击 包 含 persocon_t 对 得 的 表 。 















create tvoe dependents t as table of person tk: 
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现在 我 们 创建 一 个 带 有 eia，person，qependents 列 的 表 ， 其 中 daependente 可 带 有 
多 个 值 。 我 们 假定 eia 是 主键 。 


creatpe tabie employwees 
【 


| int, 
eperson person t, 
dependents deperndents_t, 


primary key teid] 
) nested table dependents store as dependents, tab; 


注意 ， 当 以 适当 的 列 首 次 创建 一 个 employee_t 类 型 时 ,我 们 可 以 创建 employees 起 的 
一 个 对 象 版 本 。 四 

例 4.3.1 创 建 了 一 个 标准 的 关系 表 ， 除 了 它 包含 一 个 表 类 型 列 aependents 利 一 个 形 如 

NESTED TABLE colname STORE AS tablename 
的 NESTEP TABLE 子 句 。 其 中 ， 大 写字 母 是 关键 字 。 在 例 4.3.1 中 ， 该 语 包 描述 了 一 个 名 为 
dependents_tab 的 表 ， 该 表 了 包含 凶 个 可 出 现在 employees 表 和 装 dependents 列 中 的 
person_t 对 党 这样 ， 两 个 数据 库 表 将 被 一 个 Create Table 语 句 生 成 ， 表 employees 作 为 项 
压 的 表 ， 表 dependents.tab 包 括 所 有 展 员 的 家 属 的 person_t 对 得 。 图 4-12 给 出 了 例 4.3.1 
的 employees 表 ， 该 表 带 有 两 个 雇员 行 ， 一 个 雇员 带 有 两 个 家 属 ， 而 圾 一 个 仅 带 有 一 个 。 


ED TOYees 


person_ cd224s56776. name ti sonth', Michacl'.” ‘J'}.8) 


person_r(123897766,.name_t 
{Smith', 'John', 'P'),45} 
Person_tf123822332;narme tf Snuth’, ‘Susan', R'),12} 


porson te De person_t{365534953 .name_t{'Shaw', ‘Davd',' NT ),3) 
+ 里 于 





图 4-12 带 有 赃 套 表 类 型 的 daependents 列 的 ORACLE employees 表 


我 们 注意 到 雇员 101 的 两 个 家 属 可 以 被 当 作 是 在 概念 上 构成 一 个 小 的 对 象 表 ， 如 同 雇员 
102 的 一 个 家 属 那样 ， 尽 管事 实 上 所 有 的 aepenqents 都 在 单个 的 depenaents_ ab 表 中 。 
然而 ， 这 个 概念 上 的 表 在 employees 的 单个 行 中 作为 列 值 出 现 皱 称 为 眶 套 的 表 。 

图 4-13 显 示 了 用 例 4.3.1 的 NESTED TABLE 语 柯 创建 关系 表 的 语法 。 到 现在 为 止 ， 我 们 仪 
看 到 一 个 带 一 个 媒 套 表 列 的 关系 表 例 子 ， 构 造 带 有 多 个 锯 套 表 烈 的 表 并 不 难 ， 那样 我 们 需要 
为 每 个 这 样 的 列 声明 一 个 NESTED TABLE 子 句 。 

CREATE TABLE tablename tcolumnname datatype LNOT NULL] 


{, columnname datatype [NOT NULL}...} 
[, FRIMARY KEY (columnname 41, columnname...})]} 


[NESTED TABLE columnname STORE AS tablename 
{. NESTED TABLE coilummnname STORE £5 tablename,...1}]; 





图 413 DRACLE 中 带 有 侯 套 表 存 情 描 述 的 创建 关系 表 的 语法 
注意 ， 图 4-6 Create Object Table 语 句 形 式 可 以 像 图 4-13 那 样 扩 展 ， 即 在 表 对 象 类 型 的 革 
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个 脱 套 层 上 为 每 个 表 类 型 属性 增加 一 个 NESTED TABLE 子 句 。 例 如 ， 在 例 4.3.1 中 ， 定 义 了 一 
个 带 有 aepenaent tt 类 型 的 aependents 属 性 的 :- 个 emP1loyees_t 类 型 ， 然 后 定 忱 
employees_t 类 型 的 - -个 employees 对 和 象 表 。 然 而 ， 在 ORACLE 中 一 个 表 类 型 不 能 包含 一 
个 表 类 型 属性 ， 多 层 规范 的 对 象 类 型 钥 套 以 完全 包含 一 个 表 关 型 属性 将 十 分 完美 。 这 样 ， 我 
们 能 够 创建 一 个 包含 一 个 人 当前 的 公司 名 和 雇员 信息 (在 类 型 employees_t 的 属性 内 ) 的 
属性 的 对 象 类 型 xorkhistory_t; 然后 ， 对 地 现在 第 二 层 般 套 中 的 dependents_t 属 性 使 
用 NESTED TABLE 子 旬 ， 我 们 可 以 创建 一 个 名 为 workhists 的 workhistory_t 类 型 的 对 
象 表 。 

ORACLE 怨 套 表 可 以 被 交互 地 查询 ， 但 这 种 查询 带 有 某 些 限制 。 我 们 已 看 到 谍 套 的 表 被 
包含 于 它 自身 的 数据 库 表 中 (我 们 将 称 之 为 子 表 )。， 狐 立 于 般 稻 它 的 表 ( 称 为 父 表 ) 而 存在 、 
但 是 :个 子 表 的 数据 仪 能 通过 介 表 访问 。 在 例 4.3.1 的 表 的 Create Table 庄 包 之 后 ， 在 FROM 了 
中 的 带 dependGdents_tab 的 Select 语 旬 将 无 效 ， 错 误 信 息 显 示 用 广 必 须 访问 父 表 . 

下 边 、 我 们 提供 一 些 访问 驶 套 表 的 例子 ， 

例 4.3.2 检索 雇员 101 的 所 有 家 履 的 典 套 表 。 

select dependents from emplioyees where eid = 101; 

这 将 显示 一 个 雇员 行 ， 其 中 dependents 列 为 一 个 标量 网 矢 表 值 ， 如 图 4-14 所 示 。 在 这 
个 查询 中 ， 昌 然 我 们 可 以 为 emploevees 提 供 一 个 别名 e， 写 作 es .dependents， 但 我 们 没有 
使 用 限定 符 。 只 有 对 对 象 属性 的 引用 限定 符 才 是 必需 的 ， 而 dependents 是 一 个 关系 表 的 非 
对 象 列 。 这 里 检索 到 的 后 套 的 标量 表 值 表示 包含 两 个 不 同行 的 表 一 一 但 其 本 身 并 不 是 包含 两 
行 的 束 ， 正 如 我 们 将 独到 的 那样 ， 这 种 限制 在 重要 的 例 义 。 


dependentst ssno,pnamet fname .minitial ,1name), age) 


dependents ttperson tt322456776 ,name t(*Smith'. Michael’ .J*), B}, person_tr(123822332, 
name_t{'Smith', ‘Susan’ , ‘R'y, 12}) 





图 4-14 例 4.3.2 的 两 个 家 属 的 ORACLE 输出 形式 

在 图 4-14 中 ， 骨 套 表 的 输出 格式 与 图 4-3 中 的 对 象 类 型 的 显示 格式 相似 ， 即 类 型 名 之 后 中 
着 括号 括 起 来 的 各 个 部 分 的 列表 。 国 

例 4.3.3 检索 所 有 emp Loyees 的 所 有 dependents。 

Select dependents from employees: 

这 将 为 每 个 雇员 显示 一 行 ， 其 中 ，dependents 按 图 4-14 所 示 的 格式 作为 一 个 标量 骨 牌 
表 值 列 出 。 加 

例 4.3.4 检索 有 6 个 以 上 家 属 的 雇员 的 eia。 


selEct eid from empiloYees e 
where 6 《 tselect countt*) from tablete. dependents)): 


这 是 我 们 第 一 次 看 到 出 现在 FROM 子 句 中 的 骨 套 表 ， 这 里 我 们 必须 使 用 TABLEO 坑 式 将 标 
其 虑 套 表 值 e . dependents 转 摸 成 一 个 表 ， 目 的 是 完成 其 J 上 .Select 语 句 。 各 没有 这 样 的 转换 ， 
检索 到 的 e .dependents 标 量 值 将 不 能 返回 查询 所 需 的 perscon_t 对 象 ,在 这 里 我 们 不 必 将 


Tr 
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于 查询 放 在 比较 谓词 的 右边 : ORACLE 文 持 允许 子 查询 在 任何 一 边 的 高 级 SQL 比较 谓词 。 
为 了 发 现 个 名 有 某 一 家 属 集 仓 的 emp1oyees 行 ,我们 可 能 芝 试 如 下 查询 : 


select eid from emp loyees e where e.dependents = . . - 


在 石 边 使 用 集合 构造 的 形式 描述 期 望 的 集合 。ORACLE 不 支持 购 登 表 之 问 的 等 值 匹配 谓 
词 ， 但 支持 同一 对 象 类 型 的 简单 对 象 或 内 部 类 型 之 间 的 匹配 。 下 面 ， 我 们 将 简单 对 象 定 义 为 
在 其 属性 内 无 任何 层次 的 聚集 类 型 对 象 的 对 多 。 

为 发 现 带 有 某 一 确定 家 属 的 和 雇员， 我 们 可 以 使 用 谓词 IN。 


例 4.3.5 列 出 带 有 社会 保障 号 为 3451112222 的 家 属 的 雇员 的 eias。 


select eid from emplorees e 
where 34511122e2 in 
(select d,ssno from tablete. dependents) d); 


由 于 ORACLE 支持 简单 对 象 的 等 值 匹 配 ， 我 们 一 样 可 以 检索 带 有 由 name_ 上 {'Lukas'， 
‘David'，,'EE') 指 定 的 名 字 的 家 属 的 万 员 的 eid。 
splect eid from employees e 
Where name tf Lukas' 。， ‘David", "EY in 
‘select dpnhame from tablete,.dependents} d}: 图 


在 人 前 4.3.5 的 子 查询 的 FROM 子 负 中， 我 们 又 一 次 使 用 了 TABLEO 虎 式 。 图 4-15 给 出 了 


TABLEO 形 式 的 语法 。 


图 4-15 ORACLE 中 TABLE( ) 的 形式 


注意 ,图 4-15 的 语法 要 求 可 以 指定 汇集 列 值 的 措 定 的 行 。 在 下 列 情况 下 ， 我 们 不 能 对 
TABLE() 决 定 指定 的 行 ， 因 此，TABLE0O) 形 式 不 能 用 于 提供 最 外 屋 Select 语 馈 的 FROM 子 全 
的 表 。 


select ssho from tableremplovees.dependents}; -~ Tnvalid: employees row undetermined 
将 嵌 爸 表 引 入 查询 的 另 一 种 方式 在 例 4.3.6 中 给 出 。 
例 4.3.6 假如 我 们 要 检索 雇员 101 的 家 属 数 日 ， 则 下 过 是 一 种 可 能 合理 的 方法 ; 


select counti*) from 
tselect e.dependents from employees e where ea.eid = J01}); ~-- ** UNEXPECTED RESULT 


然而 ， 不 幸 的 是 ,这 里 的 子 查 询 检 索 一 个 标量 嵌 套 表 值 e . dependents， 而 非 为 每 个 家 
属 带 有 person_t 对 象 的 表 ， 因 此 ,计算 的 结果 将 是 1( 如 果 期 望 的 彻 吕 有 空 的 
a .dependents 值 ， 出 是 中。 为 此 ， 我 们 需要 将 e .dependents 值 转 模 为 -- 个 表 ， 但 我 们 不 
能 用 选择 列表 中 的 TABLE( ) 格 式 来 完成 此 功能 ,将 子 查询 变换 为 : 


{select tablete. depandents) from emplOyEEs Be where e.eid = 101); -~ ** BAD SYHTAX 


由 于 子 查 询 的 工作 是 为 单个 行 传 递 标量 值 ， 而 不 是 为 整个 表 。 为 了 弥补 这 一 点 ， 在 它 已 
经 由 子 查询 传 递 之 后 我 们 需要 将 e.dependents 值 转换 成 一 个 圳 ， 并 有 这 可 以 通过 如 下 的 
TABLEO 形 式 做 到 这 一 点 : 
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select counte*) from 
table tselect ae.dependents from empliovyees e where eeid = 101}: 


使 出 这 种 语法 ， 我 们 市 以 得 到 单个 典 员 的 实际 家 属 数 。 首 先 ， 了 于 查询 选择 eid 交 101 的 雇 
员 并 检索 e ,dependents 作 为 一 个 标量 做 套 表 值 ; 然后 ，TABLE() 将 值 返回 到 person_t 对 
象 的 行 值 集合 中 ，COUNT 1*) 在 外 屋 Select 语 名 中 计算 行 数 。 是 

- 般 地 ，TABLE 关 键 字 可 以 被 看 做 从 一 个 子 查 询 或 集合 表达 式 产 生 的 妊 套 结果 天 值 删 
除 “ 集 澡 容器 "表现 其 中 的 所 有 行 。 这 种 分 解 子 查询 的 集合 值 为 其 内 容 的 行为 被 称 为 消除 
谨 套 集合 : 

在 例 4.3.6 中 ， 我 们 已 经 尝试 了 男 外 一 种 不 同 的 方法 : 

select countie.dependents} from employees e where eeid = 101: 

这 里 ， 我 们 和 希望 用 COUNTO 计算 这 -一 行 中 的 家 属 数 。 人 和 但是， 在 Select 语 名 中 的 
e .dependents 酝 次 表示 该 行 的 单个 嵌 套 表 值 ， 因 此 ， 我 们 将 侈 计算 从 employees 表 的 适 
当 的 行 中 选 拌 的 零 或 非 才 ， 空 或 非 空 的 e .dependents 标 量 值 。 但 事实 上 ，ORACLE 将 返 嫂 
一 个 错误 “不 一 致 的 数据 类 型 ”， 因 为 ORACLE 规定 COUNTO 不 能 采用 娟 集 值 作为 人 参数。 这 样 
的 规定 可 以 避免 混淆 。 但 是 ， 正 如 我 们 将 在 下 一 节 中 见 到 的 那样 ，INEORMIX 提 供 了 -种 在 
这 种 情况 下 代替 COUNTO 的 新 形式 ， 即 CARDINALITYO， 这 种 方式 非常 有 用 。 


例 4.3.7 ”代替 例 4.3.6 那 样 计算 eia 为 101 的 雇员 的 家 属 数 ， 我 们 可 以 从 同样 的 家 属 峙 兰 表 
中 显示 所 有 他 们 的 社会 保障 号 ， 如 下 : 


select dd.ssno from 
tabletselect e.dependents from emplorees ee where eeld 1013 d; 


这 持 ， 和 例 4.3.6 一 样 ， 子 查询 对 雇员 101 选 择 dependents 骨 套 表 ， 然 三 TABLE() 拱 作 符 
将 其 消除 栓 套 到 一 个 berscon_t 对 象 表 中 。 在 这 种 情况 下 ， 对 dependerts 舍 用 别名 4d。 在 选 
择 列表 中 的 a. ssno 选 择 要 显示 的 表 中 的 ssno 列 。 是 


2. 从 表 中 表 检 索 的 两 种 技术 

从 所 有 雇员 的 所 有 家 属 中 检索 ssno 列 的 值 不 是 一 个 简单 的 问题 。 我 们 需要 从 多 个 虑 套 表 
(每 个 雇员 一 个 ) 中 选择 ， 并 立即 报告 所 有 的 行 ， 而 不 仅仅 检索 我 们 已 经 做 过 的 郁 敬 此 的 行 。 我 
们 不 再 需要 从 表 中 表 选 择 ssno 列 值 ， 因 为 每 个 矿 套 表 不 再 是 襄 集 值 ， 而 是 已 经 变 成 了 
pergson tt 行 对 象 的 表 。 在 例 4.3.3 中 ， 我 们 实现 了 以 标量 值 的 方式 在 aependents 列 中 检索 
所 有 数据 ， 但 将 aepenaents 值 作为 其 自身 的 页 对 行 则 更 加 三 难 。 

为 了 讨论 处 理 表 中 表 的 问题 ，ORACLE 的 设计 者 们 提出 了 两 种 不 同 的 机 制 : 两 层 表 的 表 
来 积 和 内 套 游标 。 

3. 利用 表 的 来 积 消除 谋 套 

如 下 雇员 和 家 局 表 的 乘积 可 被 用 于 消除 家 属 表 的 嵌 套 ， 显 示 所 有 雇员 的 标识 和 家 属 ssno 值 。 


select e.eid, d,s5no from employees ee, tablete, dependents} d; 
这 将 显示 一 个 带 有 eid 和 ssno 两 列 的 表 ， 该 表 的 每 行 是 每 个 a8id 和 ssno 的 组 合 。 克 家 属 
的 雇员 将 不 会 出 现在 该 表 中 。 为 了 看 到 无 家 属 的 雇员 行 ( 带 有 空 ssn9)， 可 以 在 家 属 的 边 上 加 
一 个 (+) 号 ， 形式 如 下 ; 


select e.eid, d.ssno from employees e, tablete.dependents} (+) d; 
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(+ ) 号 来 自 于 3.6 节 中 介绍 的 ORACLE 的 外 部 连接 。 在 这 两 种 情况 下 ，( + ) 都 标志 着 空 秆 
将 答 瑟 人 的 另外 -个 发 的 保留 行 的 都 一 侧 。 

回忆 一 下 从 3.9 季 开始 到 3.15 节 结束 的 查询 执行 的 一 般 模 式 。 首 先 彤 成 FORM 表 的 关系 滋 
积 。 对 上 边 涉 及 到 的 table (e .dependents) 的 表 的 乘积 ， 我 们 有 一 个 修改 过 的 关系 胰 积 运 
算 。 标 准 的 乘积 将 第 一 个 袁 中 的 得 一行 和 第 一 个 表 的 每 一 行进 行 正 配 。 在 包含 消除 岂 套 的 表 
来 积 中 , 第 一 个 去 的 每 ~-- 行 和 它 白 己 的 村 集 列 值 (被 转换 为 一 个 表 ) 进 行距 配 

这 里 我 们 有 一 个 带 有 类 型 行 z 和 表 的 别名 为 e 的 employees 表 . 行 x 有 一 个 带 有 类 型 行 y 
的 名 为 dependents 的 聚集 列表 ， 别 名 为 Qa。 这 里 的 关系 蒋 积 为 对 所 有 的 x 和 产生 形 如 X7 的 
行 的 表 。 也 就 是 说 ，- -个 典型 结果 行 是 被 其 某 个 家 属 行 填充 的 雇员 行 。 每 个 这 样 的 复合 行 保 
留 它 的 某 个 雇员 和 该 雇员 的 某 个 家 属 的 信息 。 这 样 ， 我 们 可 以 在 查询 中 对 和 雇员 和 家 属 的 任意 
列 分 着 使 用 e .cotlname 和 Ga.colname 而 不 会 产生 混 请 。 随 后 的 执行 步骤 (如 while 子 句 的 处 
理 ) 根 据 这 种 无 二 . 义 值 的 方式 继续 进行 。 特别 地 ，e.dqepenadaents 汇 集 列 值 自 与 有 一 个 明确 的 
各 义 ， 在 我 们 需要 进一步 查询 :个 特定 的 雇员 的 家 属 集 合 的 时 候 ， 可 将 它 当 作 TARLEO 考 的 
主体 ， 正 如 我 们 将 在 例 4.3.9 中 看 到 的 那样 。 

4. 就 大 游标 

显示 表 中 表 的 另 -一 种 方式 是 使 用 髓 套 游 标 。 游 标 像 - :个 在 执行 查询 时 移 过 行 集 人 台 的 循环 
控制 变量 。 顶 层 的 Select 提 供 一 个 在 FROM 表 上 人像 游标 - - 样 的 循环 ， 以 产生 待 检 索 的 行 。 然 后 ， 
5 在 外 层 Select 御 环 中 遇 到 时 ， 赃 套 的 游标 语法 CURSORO 人 多 许 我 们 增加 -个 扫描 每 一 个 行 中 
内 警 表 的 第 二 层 循环 (如 果 是 多 个 艇 舍 本 凡是 更 多 的 循环 )。 

例 4.3.8 最 示 雇 员 表 中 的 所 有 行 的 eid 值 和 该 座 员 的 年 龄 小 丁 16 岁 的 任意 家 属 的 社会 保障 号 。 

由 于 必须 从 多 重 髓 套 的 表 中 显示 多 行 ， 我 们 需要 通过 涝 乘积 或 游标 的 形式 来 消除 和 套 , 
我 们 污 看 一 个 使 用 表 滋 积 形式 消除 家 属 般 套 表 的 查询 : 

select e.eid, d,s5no as dep_ sso from empiovyees e, tablete.depenmdents) d 


where d.age < lp: 


该 查询 的 输出 如 图 4-16 所 示 。 


322456776 


123822332 
S65D34595 





图 4-16 例 4.3.8 的 表 乘 积 查 询 的 DRACLE SQL*pPlus 输 出 
然后 ， 我 们 使 用 舰 套 族 标 来 检索 同样 的 信息 : 


Select eeld,. cuUrsortselect d,ssno as dep_ssno 

from tableie.dependents) of where d.age < 16} dep tab 
from employees e: 

这 里 的 SELECT 设 定 一 个 在 smplceyees 表 上 的 循 坏 ，CURSOR 设 定 在 被 给 索 到 的 每 个 
employees 行 的 dependents 骸 父 表 上 的 第 二 级 循环 ,图 4-17 纵 出 了 图 4-12 表 示 的 历 员 表 的 
显示 形式 : 外 层 循 环 发 现 eja 101， 内 屋 循 环 为 该 众 员 行 发 现 两 个 ssno， 然 后 ， 外 层 循环 发 
现 eidq 102, 内 层 循 环 再 发 现 一 -个 gsno。 
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EID DEF_TAB 


101 CURSOR STATEMENT : 
CURSOR STATEMENT : 之 
DEP_SSND 


32cd56776 
123822332 
i102 CURSOR STATEMENT : 
CURSOR STATEMENT : 2 
CDEP_3SNO 





565534555 


图 4-17 例 4.3.8 的 巾 套 游标 查询 的 ORACLE SQL*Plus 输 出 
图 


注意 ， 图 4-17 的 显示 不 是 关系 的 形式 ， 因 为 它 包 含 了 两 种 不 同 的 格式 行 ， 并 带 有 相同 的 
标题 。 岩 误 游 标 在 外 层 Seleet 扫 描 父 表 时 产生 对 肯 套 表 的 扫 措 。 外 技 扫 质 和 站 先 显示 ETDP 和 它 下 
边 的 101， 接 着 DEP_TAB 作 为 游标 表达 式 (CURSOR STATEMENT: 2) 的 别名 ， 其 下 的 内 层 
CURSORO 扫 撒 的 元 素 输 出 一 个 标记 为 dep_ssno(l 列 移 别 名 在 查询 过 程 中 产生 ) 的 表 和 eiga 
101 的 两 个 家 属 和 的 ssno 值 。 请 如 dep_ssnc 的 列 别 名 对 拆 套 洲 标 检索 的 可 读 性 是 很 午 要 的 ，。 
前 边 的 步骤 完成 后 外 层 扫 摘 显 示 另 一 个 eia 102 和 另 一 个 aeb_ssno 表 ， 这 次 仅 带 有 “个 家 属 
的 ssno。 

CURSORO) 表 达 式 的 一 船形 式 如 图 4-18 所 示 。 子 查询 可 能 返回 如 例 4.3.8 所 示 的 单个 髓 套 表 
的 列 值 或 正常 的 关系 行 集 合 。 这 两 种 子 查询 类 增 均 可 用 十 CURSOR0O, 在 使 用 关系 行 的 情况 下 ， 
CURSORO 将 称 过 子 查 章 的 所 有 行 。 


Cursor PXPpTessinn ::= cursortSubquery? 


图 4-18 ORACLE 中 CURSORDO 表 达 式 的 一 般 背 式 


在 图 4-18 中 ，CURSORO 被 划分 为 表达 式 ， 但 是 ， 它 仅 能 用 于 顶层 选择 列表 中 ， 也 就 是 说 
作为 下 列表 达 式 之 -一 : 


select expression, expression, .... from ... : 


此 外 ， 如 果 存 在 一 个 嵌 套 表 或 在 外 屋 扫 描 中 过 到 行 集合 ， 则 -个 CURSORO 可 被 用 于 男 一 
个 中 。 我 们 注意 到 游标 是 产 竺 一 种 对 帷 套 表 查 淘 的 显示 非常 有 效 的 表 中 表 数 据 的 新 方式 ， 

人 到 目 前 为 止 ， 所 有 的 Select 语 句 都 是 以 关系 的 形式 检索 数据 ， 即 每 个 被 显示 的 行 具有 同样 
的 数据 类 型 模式 (如 两 个 字 串 和 一 个 数字 )。 一 旦 我 们 允许 睹 集 对 象 值 作为 表单 元 可 接受 的 值 ， 
甚至 是 在 本 节 中 介绍 CURSOR1() 之 前 所 涉及 的 聚集 查询 的 绪 果 也 是 纯 头 系 的 表 ， 但 是 ， 
CURSOR() 的 结果 不 是 关系 表 ， 因 为 一 些 被 显示 的 行 描述 外 层 循环 的 过 程 和 一 些 内 层 循环 过 
程 ， 在 这 种 情况 下 ， 其 结果 带 有 不 同 数量 和 类 型 的 数据 值 。 

另 一 方面 ， 如 图 4-16 所 示 ， 表 乘积 查询 按 关系 的 方式 检索 数据 。 如 果 你 对 单个 雇员 有 多 
个 行 不 介意 的 话 ， 则 这 种 显示 方式 更 加 简单 耳 观 。 


例 4.3.9 按 最 老 的 家 属 的 和 名字 列 出 雇员 名 和 eia。 


-一 一 二 Te r 本 
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SeElect eid,. cursortselect di.prame.fname from tabletemplorees,dependents}) di 
where dl.age = {seElECt maxtd2. ge from tablerempl ovrees, dependents) dt2)) 
from employees: 
网 4-15 给 出 的 TABLEQ) 的 语法 及 其 后 的 讨论 意味 着 如 下 语 唐 ; 
select fname from tabletemp loyvees.dependents» di 
可 能 产生 问题 。 因 为 TABLEO 必 须 以 单 层 徽 套 表 的 列 值 作为 参数 ， 外 层 Seleet 诸 名 中 的 
employees.dependents 对 单个 行 没有 约束 。 然 而 ， 在 当前 的 例子 中 ，empl]oyees. 
qepenaents 少 人 和 人 CURSOR0D 表 达 式 的 子 查询 中 并 反 向 引用 外 导 Seleet 循 环 的 emplIovees 限 定 符 . 
尼 在 CURSORO 开 始 查 询 行 的 壤 套 表 之 前 总 是 稳定 在 employees 的 单个 行 上 ， 
苦 不 用 让 套 游标 检索 ， 我 们 棵 使 用 两 次 TABLEO 形 式 ， 一 次 形成 表 和 各， 另 一 次 产后 可 以 
在 其 上 对 某 个 雇员 计算 家 属 的 最 大 年 齿 的 表 。 


select eid, dpname.fhame from employees e, tablere.dependentsy di 
where dl,age = (select maxtd2,.agey From tablere.dependents) d2)): 


例 4.3.10 条 例 4.3.6 中 ， 我 们 计算 了 某 个 雇员 家 属 数 。 我 们 也 可 以 检索 计算 分 别 阁 于 每 个 
雇员 的 家 属 的 多 行 结果 : 


select eid, cursortselect countt*) from tablete.dependents)) 


from employees ee; 
许 套 游标 扫描 外 层 Select 的 每 个 雇员 行 的 许 衰 表 并 计算 depenqdents 表 的 行 数 。 在 输出 时 
没有 显示 内 层 的 表 如 图 4-17 中 的 dep_ssno )， 国 为 内 层 表 中 没有 每 个 家 属 的 数据 可 显示 。 
作为 选择 ， 我 们 可 以 删除 这 里 的 CURSORO 并 在 选择 列表 中 使 用 结果 的 标量 子 查询 ,一 种 
高 级 SQL 特征 。 
select eid, iselect counte*y from tabletre.dependents,} 
from empl oyees ee: 


最 后 ， 我 们 怠 以 用 表 乘 积 消 除 嵌 塞 。 


select eid, countt*) from employees e. tabile{e.dependents}) 

group by eid; 

例 4.3.10 给 出 了 查询 每 个 雇员 的 家 属 数 的 不 同方 式 。 为 了 计算 麻 员 的 所 有 过 属 数 ， 我 们 必 
须 使 用 表 乘 积 以 消除 胡 僻 ， 因 为 这 是 能 够 使 我 们 无 锋 地 跨越 密 个 雇员 行 集合 的 唯一 盯 能 的 形 
式 。 我 们 可 以 写 ; 

select countt*) from employvees ee, tablete.dependents?}; 

$5, VARRAY 数 组 并 型 

ORACLE 的 另 一 种 汇集 类 型 即 数组 类 型 ， 以 WARRAY 声 明 ， 代 表 “ 变 长 数组 "。 每 个 数组 
类 型 声明 有 一 个 和 名字， 一 个 元 素 类 型 ， 一 个 VARRAY 对 象 可 以 也 合 的 最 大 元 素 个 数 ( 和 
varchar 类 型 一 样 ， VARRAY 的 实际 大 小 不 是 正比 于 这 个 最 大 数 ， 而 是 正比 于 其 所 含 的 实际 元 素 
个 数 )。 不 像 嵌 套 表 类 型 ，VARRAY 类 型 的 元 素 有 特定 的 次 序 。 

例 4.3.11 建立 一 个 简单 的 电话 号 码 本 : 每 个 人 有 4 个 以 整数 表示 的 电话 扩展 导 的 
VARRAY。 拨 号 人 应 该 先 尝试 第 一 个 扩展 号 ， 然 后 第 二 个 扩展 号 ， 依 次 拨 续 。 由 于 在 第 一 个 
号 后 的 扩展 导 应 属于 合作 者 ， 这 种 按 次 友 拨 号 的 规则 是 和 根 重要 的 ， 以 便 全 作者 免 受 不 必要 的 
打 拢 。 
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treate type extensions_t as varray{td}y of int; 
create table phoneboox 
【 

Phperson pearson_t, 

externsions extensions t 


); 加 

与 持 套 表 不 同 ，VARRAY 数 据 通 常 直接 包含 在 表 的 行 中 。 因 此 ， 在 Create Table 语 句 中 不 
像 例 4.3.1 奢 样 需要 专门 的 存储 子 名 。 在 某 些 情况 证 ，VARRAY 数 据 可 以 存放 在 外 部 ,但 对 此 
我 们 不 做 深信 的 讨论 。 同 样 ， 我 们 可 以 看 到 ， 在 这 里 没有 使 用 主键 子 句 ， 因 此 在 该 表 中 同一 
个 人 可 能 对 应 师 行 。 或 者 我 们 可 以 通过 将 下 迪 的 语句 加 人 到 Create Table 语 名 中 ， 亦 
phperson 列 的 ssno 属 性 的 基础 上 建立 主键 ， 


primary key (phperson,ssno) 
图 4-19 给 出 了 一 个 对 Johoe Smith 有 两 个 扩展 导 和 对 Divid Andrews 有 一 个 扩展 号 的 小 
phonebook 表 。 


phonsbook 


person_t{123897766, name_tt'smith', John', 'P'), 451 extensioms_tt345, S83) 
person_tt432112743, name_t('Anmdrews', David', '$'), 32) extensions t{123) 


图 4-19 带 整 数 extensjons 的 ORACLE VARRAY 询 的 phonebook 表 
例 4.3.12 检索 社会 保障 号 为 123897766 的 人 的 名 字 和 VARRAY extensions。 


select ph,phperson.fname, pb.extensions from Phcnebook pb 










where pb.phperson, ssno = 123897766; 


这 将 对 每 个 人 显示 一 行 ， 带 有 如 下 标量 VARRAY 值 的 extensions， 结果 如 图 4-20 所 /水 。 


phperson.fname Extensions 


他 光电 站 与 二 站 直属 各 瑟 ,全 训 





图 4-20 DRACLE 对 例 4.3.12 的 查询 的 WARRAY 列 值 的 输出 
区 


注意 ，SQL 语 名 实际 上 无 法 访问 一 个 以 YARRAY 定 义 的 对 象 的 下 标 元 素 ， 如 例 4.3,12 中 
的 选择 列表 中 出 现 pb .extensions[1]( 你 可 以 将 VARRAY 转 撞 为 锯 套 表 并 访问 单个 行 ,但 
是 行 的 相对 次 序 无 法 保证 )。 除 了 显示 整个 育 集 值 让 读者 从 左 到 右 去 计算 以 外 ,我们 不 能 访问 
第 一 个 扩展 或 其 他 任何 编导 的 下 标 苑 素 。 当 我 们 在 第 4 章 中 考 屿 SQL 程序 语 育 接 口 时 ， 从 一 
行 中 检索 到 的 YARRAY 将 被 喘 射 到 一 个 编程 语言 数组 中 ， 只 有 那 时 才能 访 间 带 下 标的 
VARRAY 元 素 。 

在 -个 查询 中 ，TABLE( ) 表 同样 可 以 碳 用 于 VARRAY 伯 。 

例 4.3.13 在 Phonebook 表 中 导 找 社会 保障 号 为 123440011 的 人 所 拥有 的 扩展 号 , 


select {select count{*) from tabletph.extensions}} from phonebook pb 


where Pb.Phperson.ssno = LP3d440011; 


me 二 ie -本 。 
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成 者 使 用 下 边 的 语句 : 
select count(*) from phonebook ph, tabletph.extensions} 
where ph.phperson.ssro = 123440011: | 


例 4.3.14 绚 出 具有 扩展 号 104 的 phonebook 表 中 的 人 。 
select phperson from phonebonk pb 
where 104 in select * from tabletpb.extensions}}:; | 

有 时 我 们 需要 将 一 个 聚集 类 型 转换 为 另 一 个 类 型 或 从 一 个 行 集合 转换 为 汇集 类 型 。 例 如 ， 
我 们 可 能 有 一 个 person_t 构 套 表 作为 一 个 列 值 并 使 用 它 去 更 新 person_t 的 一 个 YARRAY 
类 型 列 ， 或 者 将 一 -个 子 查询 中 的 关系 数据 填充 - -个 汇集 值 。 图 4-21 给 出 了 江 : 集 类 型 的 CAST 表 
达 式 的 -- 般 形式 。 下 这 的 collection_type 必 须 使 用 一 个 由 套 表 (如 dependents_t) 或 
VARRAY 类 型 (如 extensions_t ) 替换 。CAST 起 达 式 允许 识 食 表 或 YARRAY 的 表达 式 或 
于 查询 被 转换 为 为 一 个 谋 套 表 或 YARRAY 类 型 值 。 这 种 使 用 CAST 实 现 从 一 个 VARRAY 类 型 到 
嵌 套 表 类 型 或 从 迄 套 表 类 型 到 VARRAY 类 型 的 转换 是 医 常 有 用 的 。 


collection cast expression :: = 
CASTICol iection valued expr AS collection type) 


[CASTItcol lection_valued subquery) AS collection trpe!) 
[CASTEMULTISET Irowset_valued subqueryy AS collection type) 





图 4-21 ORACLE 中 的 CAST 表 达 式 的 一 般 形 式 


在 图 4-21 的 最 后 一 行 中 的 MULTISET 形 式 被 用 于 包含 一 个 返回 我 们 希望 转换 为 YARRAY 
或 骨 套 表 的 行 集合 的 子 查 沿 。 南 于 在 INFORMIX 中 的 多 重 集 全 finultiseb 有 不 同 的 含义 我们 
将 后 边 出 现 的 传统 关系 查询 返回 的 行 集合 被 称 为 行 集 ， 

下 边 给 于 一 个 MULTISET 的 例子 ， 该 例 于 将 所 有 家 属 的 社会 保障 号 收集 到 - -个 汇集 类 
型 中 。 


Create type ssno_set as tablie of int: 
select eeid, cast{imultisetselect d.ssno from tablete.dependentsy d 
Where d.age < 16) as ssn0_ set) as dep_ssno 
from emplorees ge: 

这 个 查询 将 输出 每 个 雇员 eid 利 一 个 ssno_set {}) 髓 套 表 信 . 可 以 看 到 ，MULTISETO 与 
TABLE( ) 相 反 。MULTISET 将 一 个 行 集 变 为 汇集 值 ， 侧 TBALE( ) 将 汇集 信 变 为 行 集 .。 上 : 边 的 
查 向 消除 家 属 髋 套 ， 从 中 取出 ssno 值 ， 并 将 它们 艇 套 为 汇集 值 。 

6. ORACLE 中 汇集 的 SQL 语 法 . 

RDBMSJ 商 和 SQL 标 准 制定 者 希望 将 汇集 类 型 包括 在 ORDBMS SQL 的 语法 中 ， 然 而 ， 
他 们 面临 着 比 最 初 想象 更 难 解决 的 问题 。 他 们 的 日 标 是 遂 过 扩展 关系 查询 的 语法 来 查询 嵌 套 
表 的 内 容 。 显 然 ， 如 图 3-11 所 示 的 SQL-99 扩 展 ， 在 FROM 子 人 条 中 ， 跟 在 FROM 后 面 的 
tableref 子 名 就 是 一 个 推广 语法 以 包括 馈 套 表 的 地 方 ，ORACLE 采 用 了 这 种 方式 。 

图 4-22 的 tableret 语 法 定义 包含 两 种 关系 形式 【图 3-11 中 的 前 两 种 方式 : 基 木 
tablename 形 式 和 rowset_valued_subpquery) 和 一 个 新 的 沪 集 形式 。 注 意 到 
tableref 之 后 总 跟着 一 个 FROM， 所 以 新 的 查 疝 格式 为 FROM TABLE( )， 


eh i 
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tableref: := {tabtlename | trowset valued subquery) 
| TABLE {collection expr}} -- collection-valuaed subqueary, etc. 


Leorr_namej 一 LE 





图 4-22 ORACLE 中 的 tableref 子 查询 形式 的 语法 (与 出 3-11 相 比 ) 
回顾 图 4-14 的 俩 4.3.2 的 显示 格式 : 


dependents_t{person tt322456776,.name_ tt Smith' ,Hichael' .Jd'), 号 ) ， 
person_ ttl23822332, name_tt 3WTth ， “Susan". "RR'}, l2}} 

这 样 的 语法 也 可 以 被 用 作 府 套 表 构 造 器 失 适 当 的 类 型 表达 式 建立 一 个 特定 的 嵌 套 表 。 类 
似 地 . 

extensions. tt395,567} 
征 一 个 VARRAY 梅 造 器 ， 通 过 它 我 们 可 以 建立 一 个 extensions.t 类 型 的 VARRAY。 
VARRAY 构 造 器 和 刁 套 表 构 造 如 都 镜像 了 图 4-5 显 示 的 ORACLE 对 象 构造 器 的 语法 。 这 些 汇集 
构造 器 以 和 对 象 构造 器 一 样 的 方式 用 于 插入 和 更 新 。 

注意 ,根据 图 4-22，FROM TABLE(…) 可 把 一 个 汇集 表达 文 转换 为 一 个 行 集 。 汇 集 表达 
式 可 以 是 以 下 指定 一 个 个 套 表 或 VARRAY 类 型 值 的 任意 一 种 方式 : 

* 汇集 值 子 查询 : 返回 单个 向 量 汇 集 值 的 子 查询 。 

* 例如 (select e.dependents from employees e where eid = 101), 

* 列 或 属性 表达 式 。 例 如 e . dependents。 

* 产生 一 个 聚集 值 的 CAST 表 达 式 

* 返回 汇集 值 的 函数 

7. ORACLE 中 的 播 入 和 更 新 

简单 的 搬入 和 更 新 使 用 汇集 构造 器 梅 成 的 新 行 和 行 的 新 列 值 。 


例 4.3.15 在 smplLovees 表 中 搬 人 -个 John Smith 雇 员 行 ， 如 图 4-12 所 泵 。 


Tnsert into employees YalUes (101, person tt123897756, name_ 七 t "Smith ， ‘John’ , "PP 二 5 
dependents_ tiperson t{322456776.name t('Smith’, Michael”. “J"}, 有 8， 
person_t(123822332. nate_t{'Smith", ‘Susan'."R'},12))): 


在 phonebook 表 中 为 john Smith 插 人 人 一行， 如 图 4-19 所 未 。 


insert into phonebook values person t{123897766, name _t('Smith’, ‘John', PY. 45). 
extensions. tt345.9089)); 


将 phonebook 表 中 的 John smith 的 扩展 列表 车 新 为 345 和 999 。 

Update phonebook set extensions = extensions t(345,999) where eid -= 101: 

在 DRACLE 中 ， 通 过 使 用 语法 形式 TABLEfnested_table_subquery)] 返 回 . -个 标量 媒 套 表 值 
到 一 个 普通 表 中 , 我 们 可 以 插入 或 更 新 一 个 已 经 存在 的 媒 套 表 中 的 元 素 。 

例 4.3.16 为 雇员 John Smith 插 人 一 个 新 的 家 属 。 


insert intoa tabletselect e.dependents rom emploYyees e 
Where a.eperson.ssno 一 123897766} 
Nalues (344559112, name_tt"Smith"” , “Diane , nul1), 0); 


注意 在 嵌 套 表 中 播 人 新 家 属 的 这 种 能 力 是 令 人 吃 怀 的 。 这 里 的 Insert 语 句 将 葵 加 到 子 查询 


rr 
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指定 的 菜 个 雇员 John Smith 的 dependents 髓 套 表 的 行 ， 骨 将 这 些 行 的 集合 包装 在 一 个 脱 套 
表 汇 集 容器 中 以 完成 播 人 操作 。 这 种 操纵 能 套 表 的 行 的 能 为 是 非常 有 用 的 . 

接 于 来 ,我们 将 显示 如 何 揭 新 某 个 殿 员 的 所 有 家 属 。 这 个 例子 将 所 有 履 员 的 【小 写 子 全 
表示 的 ) 姓 改 用 大 写字 母 表示 : 


update tabletselect e.dependents from employees e where eeid 一 TO01) dd 
set d.pname.1name = upperid.pname. name}: -- convert last name to uppercase 


这 里 我 们 不 能 仪 用 一 个 Update 语 钊 来 完成 对 所 有 雇员 的 家 属 的 更 新 。 游标 内 能 用 于 Select 
语 钉 ， 所 以 ， 我 们 不 能 在 单个 Update 语 句 中 使 用 游标 来 遍历 所 有 人 的 所 有 dependents。 国 

尽管 对 揪 人 或 更 新 可 以 使 用 TABLE(subquery) 来 指 完 从 套 表 ， 却 不 能 用 米 指 定 VARRAY 类 
型 。 因 此 ， 我 们 涉 能 以 例 4.3.16 的 方式 来 插入 或 殉 新 YARRAY 中 的 单个 元 求 。 在 例 4.3.15 中 ， 
我 们 已 经 帮 到 如 何 用 Update 语 句 米 蔡 挤 单个 phonebook 行 的 扩展 的 整个 YARRAY. 

在 下 边 的 例子 中 ， 我 们 将 看 到 在 从 另 -个 表 汇 集中 选择 家 局 集 时 如 何 针对 - -个 特定 的 雇 
员 的 aependents 泡 集 俩 用 子 查询 。 

例 4.3.17 将 ceople 表 的 所 有 行 插 入 John Smith 的 aepenaents 表 中 。 


insert into tablet select ge.dependents from employees e 
Where e.eperson.ssno = 123897766) 


select * from People: 


4.3.2 INFORMIX 中 的 汇集 类 型 


INFORMIX 中 有 -种 汇集 类 型 : 全 合 ， 多 重 业 合 和 列表 。 给 定 任 意 - -个 类 型 x_ 上 ， 我 们 
可 以 将 其 变 为 汇集 类 型 中 的 : -个 无 素 类 型 : SET(x_t)、MULTISETI(x_t) 和 LIST(x_L)。 
JNFORMIX 人 允许 集合 的 集合 种 列表 的 集合 。 我 们 将 在 本 节 中 讨论 集合 和 列表 。 多 重 集合 与 集 
合 一 样 ， 在 多 重 集合 中 集合 是 无 序 的 元 秦 江 集 ,， 但 与 集合 不 同 ， 多 重 集合 还 多 许 重 复元 素 。 
注意 不 要 将 INFORMIX 中 的 多 重 集合 汇集 类 型 和 图 4-21 中 介绍 的 ORACLE 中 的 MULTISET( ) 
形式 相 混 请 。 

在 数学 中 ， 集 合 是 一 个 无 序 的 元 素 沪 集 ; 这些 元 束 必 须 类 型 相同 ， 且 元 素 间 无 重复 - 
SET 闫 型 可 以 以 类型 或 表 定 义 的 形式 出 现在 任意 内 部 类 型 可 以 出 现 的 地 方 。 例 如 ， -个 点 的 
单个 列 可 能 是 一 个 集合 类 型 。 上 正如 我 们 后 面 将 要 说 明 的 那样 ， 集 合 大 致 对 应 于 DRACLBE 中 的 
股 套 表 。 

列 丫 是 一 个 允许 重复 的 有 序 元 素 汇 集 。 例 如 ， 地 址 在 不 同 的 环境 中 有 不 同 的 行 号 ， 内 此 ， 
一 个 字符 串 列表 是 保留 它们 的 一 种 方便 的 方法 。 列 表 对 应 于 ORACLE 中 的 YARRAY 类 型 ， 但 
列表 对 元 素 的 最 大 数目 没有 限定 。 

1. INFORMIX 中 的 集合 

为 了 与 我 们 在 ORACLE 中 使 用 的 例子 保持 一 致 ， 我 们 将 对 empPloyees 表 中 的 
dependents 列 使 用 SET(person_t) 类 型 ， 对 phonebook 表 中 的 电话 扩展 号 使 用 LIST(int) 
类 型 ， 同 样 ， 我 们 将 对 emp loyees 和 phonebook 使 用 传统 关系 表 { 不 用 类 型 表 ), 但 叮 以 用 
类 型 点 蔡 代 关系 表 ， 

例 4.3.18 ”为 雇员 创建 一 个 关系 表 ， 带 有 - -个 int 类 型 的 eig 列 、person_t 行 类 型 的 
eperson 列 种 包 合 person_t+ 友 素 集 合 的 dependents 列 。 
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create table employees 


【 
id int, 
后 PeFson person t, 
dependents setrperson_t mot null} 


}; 
在 ORACLE 中 ， 我 们 首先 为 家 属 在 套 表 定义 一 个 dependents_t 类 型 ， 再 症 Create Table 
语句 中 使 用 它 。 在 INFORMIX 中， 我 们 不 必 命 名 汇集 类 型 ， 我 们 只 需要 在 Create Table 诸 句 中 


简单 地 使 用 SET 来 定义 一 个 集合 类 型 。 注 意 在 SET 类 型 说 明 SET (person_t NOT NULL} 中 ， 
关键 字 NOT NULL 是 必须 的 . 图 


图 4-23 显 示例 4.3.18 中 的 employees 表 ， 其 内 容 为 两 个 雇员 行 ， -- 个 雇员 带 有 两 个 家 
属 ， 另 一 个 仅 带 一 个 家 属 。 


Emp lovees 


EE Ere 


rowl123897766, row! ‘Snith', 
‘Jobn', "P45)) 





dependents 

















setlrowl322446776, row!{ Smith Michael', J),8), 
row{123822332, rowt’ Smith’, Susan',' R'),12)} 



















rowld32112233 .row Andrews', 
‘David', '$"),32) 






set{rowl S65 5334535,row! Shaw', David',' MI'),3)] 





图 4-23 带 行 类 型 person_+ 集 合 玫 doependents 的 INFORMIX employees 表 


例 4.3.19 检索 eid 为 101 的 雇员 的 所 有 家 属 的 集合 


select dependents from employees Where eid = 101: 


这 将 对 该 雇员 显示 一 行 ， 带 有 如 图 4-24 所 示 的 汇集 值 的 形式 列 出 的 家 属 。 类 似 地 ， 查 询 


Se1ect * from employees: 


将 对 每 个 雇员 显示 这 样 的 家 属 的 集合 和 其 他 的 列 。 


dependents 
Setirow( 322456776,. Font Smith Michael' ,Jd'}, 8}, row(t 123822332, rowt'Smith’. 


"Susan’, "R'}, 12}] 





图 4-24 例 4.3.19 查 询 带 集合 值 的 列 INFORMIX 输 出 


INFORMIX 同 样 允许 我 们 在 一 个 集合 中 使 用 CARDINALITY( ) 格 式 计 算 元 素数 日。 
例 4.3.20 计算 雇员 101 的 家 属 数 。 


select cardinalitytdependents) from employees Where eid = 101. 


检索 带 有 6 个 以 上 家 属 的 雇员 的 eias 


seleact etd from employees 
where cardinal tytemployees.dependents}) » 6; 加 


与 ORACLE 不 间 ，INFORMIX 支 持 集 合 是 否 相 等 的 测试 ， 下 面 是 一 个 例子 。 
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例 4.3.21 找 出 所 有 带 有 相同 aependents 集 台 的 和 雇员， 每 次 列 出 一 个 麻 员 对 。 


selert el.eid, e2.eid from emplorees el, emPlOYees 2 
where el.eid < a2.81d and el.dependents 一 e2.dependents: 呈 


在 INFORMIX 中 的 IN 谓词 被 用 于 测试 一 个 汇集 中 的 某 个 特定 的 元 素 。dependents 集 合 
中 的 一 个 特定 的 万 素 是 一 个 person_t 行 类 型 对 篆 。 我 们 可 以 使 用 行 构 造 髓 表达 式 ROW ...} 
并 将 结果 转换 为 一 个 适当 的 类 型 来 构造 这 样 的 对 象 ， 如 4.2.2 节 所 述 。 

例 4.3.22 通过 对 perecon + 对 象 的 匹配 ， 列 出 以 Pavid Shaw 为 家 属 的 座 员 的 eiq。 


se1lect eid from employees 
where casttrowt 65534555, cast{rowt Shaw’ 。 "David MY) as name_t) ,3 as person_t) 


in employees .dependents; | 


从 9.2 版 本 开始 ，[INFORM 玫 使 用 汇集 驱动 表 的 形式 TABLE( )， 其 工作 方式 与 ORACLE 中 
的 TABLE( ) 相 同 ， 如 图 4-22 所 示 。INFORMIX 的 TABLE( ;格式 作用 于 由 一 个 表达 式 指定 的 参 
数 汇 集 值 ， 或 作用 于 返回 单个 汇集 值 的 -- 个 子 查询 ， 并 将 其 转换 到 -- 个 由 汇集 元 素 组 成 的 行 
表 中 ， 直面 是 一 些 例 子 。 

和 例 4.3.23 列 出 家 属 社会 保障 号 为 322456776 的 雇员 的 eid。 


select eid Trom empliorees e 
Where S22456776 in 


(select d.ssno from tablere.dependents) di); 国 
例 4.3.24 “ 显 东 eia 为 101 的 廊 员 的 家 属 的 所 有 社会 保障 号 (和 ORACLE 中 的 例 4.3.7 相 


比较 )。 
Setect d.ssno trom 
table (select e,dependents from employvees e Where .eid = 101) a; 


这 里 的 -查询 选择 雇员 101 的 dependents 央 套 表 ， 然 后 TABLE( ) 形 式 将 其 打 平 到 
person._t 对 和 象 表 中 。 在 这 个 例子 中 ， 该 表 被 赋予 别名 dd， 选择 列 站 中 的 a .ssne 选 择 要 显示 
的 该 表 的 ssnc 列 。 图 

例 4.3.25 显示 employees 肯 中 的 所 有 行 的 eid 值 ， 以 及 对 于 得 个 eid， 该 雇员 年 龄 小 于 16 
岁 的 家 属 的 煞 月 。 


select e.eid, {select countt*) from tablete,dependents) d 
where d.age < 163 


from employess e; 

这 里 的 SELECT 在 emp1l1oyees 表 上 设 定 一 层 循环 ， 子 查询 在 某 个 雇员 的 家 属 的 艇 套 表 上 
设 定 第 二 层 循环 。 大 

注意 ，INFORMIX 和 ORACLE 一 样 多 许 在 选择 列表 中 返回 单个 值 的 了 查询 。 这 和 神 能 力 已 
被 用 于 INFORMIEX 的 例 4.3.25 中 和 DRACLE 的 例 4.3.10 中 。 然 而 ， 通 过 使 用 DRACLE 的 
CURSOR( ) 语 法 或 例 4.3.8 的 专门 的 表 乘 积 ， 我 们 可 以 列 出 所 有 雇员 的 年 龄 小 于 16 岁 的 家 属 的 
社会 保障 号 。 这 种 表 中 表 类 型 的 扫 措 不 能 在 社会 保障 号 放 在 输出 不 同行 的 单个 INFORMIX 
SQL 语句 中 执行 。 这 可 以 通过 搜集 每 个 与 员 的 家 属 所 有 社会 保障 号 到 一 个 汇集 对 象 中 ， 然 后 
肯 显 示 这 个 汇集 对 象 ， 如 图 4-21 中 的 ORACLE 查询 所 示 。 
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select e.eld, multiset(select Ttem ssno from tablere.dependerntsy 
where age < 二) 
from employees e; 


另外 ， 我 们 也 可 以 使 用 INFORMIX 的 用 户 定 多 函数 和 其 他 形式 的 过 程 化 程序 来 实现 上 述 
查 调 。 我 们 将 在 4.4.2 节 讨论 INFORMIX 的 用 户 定 多 函数 。 

2, INFORMIX 列 表 

在 INFORMIX 汇 集 类 型 中 ， 列 表 和 和 多重 集合 很 相似 ， 它 们 都 有 操纵 元 素 的 IN 和 
CARDINALITY， 并 使 用 TABLE( ) 形 式 将 汇集 转换 为 可 以 被 查询 的 表 。 因此 ， 所 有 的 汇集 类 型 
在 查询 中 的 使 用 也 非常 相似 。 列 表 与 集合 的 差异 在 于 列表 中 的 元 素 是 有 序 的 ， 且 像 ORACLE 中 
的 WARRAY-- 样 允许 元 素 重 复 。 但 是 ， 当 --- 个 列表 被 TABLEI ) 转 搞 时 ， 其 次 序 丢 失 。 

例 4.3.26 像 ORACLE 例 4.3.11 一 样 ， 建 立 一 个 phonebook 表 。 其 中 每 个 人 有 一 个 整数 电 
话 扩 展 号 列表 ， 次 序 是 重要 的 : 第 一 个 导 是 主 扩展 导 ， 紧 跟着 是 第 二 扩展 号 ， 依 此 类 推 。 


create tabls phonebook 


‘ 
phperson person_t. 
extensiogns listtint not null) 


) 

注意 这 里 没有 主键 定义 子 句 ， 所 以 在 表 中 同一 个 人 可 能 对 应 两 行 。 在 ORACLE 的 例子 中 ， 
我 们 可 以 将 phperson .ssno 用 作 主 键 ， 伍 是 INFORMIKX 不 支持 那样 的 定义 。 当 然 ， 如 果 有 
必要 ， 我 们 可 以 描 加 一 个 顶层 ssno 列 并 将 其 定 闵 为 主键 。 | 

图 4-25 像 图 4-19 一 样 描述 了 对 于 John Smith 有 两 个 扩展 导 和 对 于 David Andrewa 有 一 个 扩 
展 号 的 小 phonepook 表 ， 一 个 扩展 345 是 Smith 的 主 扩展 号 而 898 是 次 扩展 号 


phonebook 


rowf123897766, row!'Smith'’,'Jobn', 'P'},45) list[345,989} 


List{123) 


图 4-25 带 整 数 esxtensjons 列 表 值 列 的 INFORMIX phonebpook 表 



















row{432112233,row('Andrews', David', 'S'),32} 


例 4.3.27 检索 年 龄 大 于 30 的 所 有 人 的 各 和 扩展 导 列 表 。 


select phperson. phame. fname, extensions from phonebook 
where phperson.age » 30; 


这 将 为 每 个 人 显示 一 行 ， 带 有 扩展 列表 作为 单个 汇集 值 。 参 见 图 4-26， 其 中 的 列表 构造 
器 用 大 插 号 {) 而 非 ORACLE 的 VARRAY 构 造 器 使 用 的 括号 格式 。 


eXtensions 


1ist{345.989} 
list{1l23} 





图 4-26 便 4.2.27 的 INFORMTX 查 淘 的 带 列 表 值 的 列 的 输出 
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我 们 可 以 ) 汉 地 对 列表 使 用 包括 相等 测试 在 内 的 可 作用 于 集合 的 操作 ,但 我 们 必须 注意 
次 序 问 题 。 
例 4.3.28 控 出 电 玫 本 中 的 社会 保障 号 为 123897766 的 人 的 扩展 号 的 数 自 。 


spelect cardinalitytextensions) from phonebook 
where phperson.ssno = 123897766: 


列 出 扩展 号 为 123 的 人 |: 


select phperson from phonebook 


where 1]23 1n extensions: 


列 出 共有 相同 的 扩展 列表 的 人 对 : 


select phl.phperson, pb2.phpersonr frow phonebook pbl. phonebook pb2 
where phl.extensions = pb2.extensions and pbl.phperson 《> pb2.phperson:; 


由 于 我 们 仪 要 求 phperson 值 行 类 型 不 等 ， 这 里 的 输出 对 每 个 对 显示 两 次。 如 果 我 们 知 
道 社 会 保障 号 是 非 空 的 ， 则 我 人 可 以 使 用 pbt .phperson.ssno <> Pb2.phperson. 
ssmno 代 蔡 售 询 中 的 不 等 条 件 来 消除 重复 。 国 


例 4.3.29 检索 扩 屡 号 为 123 且 无 其 他 扩展 号 的 人 。 


select phperson froem phonebcok 


Where phperson.extensions = 1ist{123}; 


这 里 ， 我 们 使 用 列表 构造 器 来 定义 包含 单个 整数 常量 的 列表 。 从 INFORMIX 9.2 起 ， 
"listC423) 两 边 的 双 引 号 可 以 省 略 。 量 

3. INFORMIX 中 的 汇集 的 SQL 语 法 

INFORMIX 中 的 汇集 值 表达 式 具有 图 4-27 所 示 的 各 种 形式 。 这 里 没有 在 表达 式 中 实现 江 . 
集合 并 的 操作 ， 比 较 图 4-27 和 图 3-16 的 数字 表达 式 的 定 交 。 


1 .val: 常数 或 让 量 "set{'a  . “bh”, “list{i1,2)™, :citylist 
2. 汇 集 构 造 器 表达 式 set{f"a’, ‘b'||'c}, 1istll+5,2*age] 
3. 列 台 dependents 


ph.extensions, a.b.mycollection 


4. 点 分 表达 式 


5.{ 子 查询 ) 返 回 一 个 计 集 
case When cardinalitytextensions} 2 0 extensions 
6.case 坊 达 式 else Tist {i000 


(select dependents from employees where eid = 101) 





图 4-27 INFORMIX 的 汇集 从 表达 式 Ccollvexpr) 定 多 
在 INFORMIX 查 询 中 ， 任 意 汇 集 值 表达 式 均 可 用 于 选择 列表 中 ， 如 等 值 比较 调 词 或 IN 谓 
词 。 图 4-28 给 出 了 对 SQL 的 相关 语法 的 扩展 。 注 意 CARDINALITY{ ) 不 能 以 一 般 的 集合 值 表 达 
式 为 参数 ， 它 要 求 汇集 类 型 的 列 名 。 
例 4.3.30 我们 曾 提 到 若 在 表 的 创建 时 缺乏 主键 子 句 意味 着 对 应 同一 个 人 可 能 有 重复 行 出 
现 。 下 边 的 语句 检索 重复 的 人 。 
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select pb,phperson from phonebook ph 
group by pb.phpersen 
having countt*y > 1; -- remove Unduplicated people 


CARDTNALITYt colname) -- an extension to numvexpr 
IN collvexpr -- an extension to the IN predicate 


TABLEC COT] vexpr} -- fm place of a tablename in FROM ... 





图 4-28 INFORMIX SOL 汇 集 的 一 般 形式 


这 个 查询 可 以 作用 于 整个 bperson 对 象 ， 但 不 能 将 相应 的 查询 用 本 bb .phperson ， 
ssno; INFORMIX 在 9.2 版 中 的 GROUP BT 语句 不 完全 支持 对 字段 的 操作 。 

4. INFORMIX 中 的 禧 入 和 更 新 

播 人 和 更 新 需 使 用 汇集 构造 器 将 汇集 值 放 午 到 表 中 。 在 aependents 志 的 例子 中 ， 我 们 
有 一 个 person_t 行 类 型 。 


例 4.3.31 在 phonebook 表 中 为 图 4-25 的 John Smith 插 入 一 行 ， 


insert into phonebook values 
ceasttrow( 123897766,castirowt' Smith' ,John','P’) as name t).45) as person ty, 
Fist13d45.,.389}}; 


在 employees 表 中 为 图 4-25 的 Jonn Smith 插 人 一 个 雇员 行 。 


insert into employees values 1, 
casttrowt 123897766, casttrowt'Smith", John',P') as name_t} ,45) as person_t), 
set {rowt322456776,. row(' Smith ,Michael’, 和， - -HOTE NO CASTS HERE 
row( 123922332,rowc Smith ,Susan’ .RKR' .12)}): 


在 版 本 9.2 中 ， 集 合 构 造 器 SET( ) 中 的 行 构造 器 ROW(.…) 可 被 转换 为 适当 的 行 类 型 name 上 
和 person _t, 
将 phonebook 表 中 John Smith 的 扩展 列表 中 的 扩展 导 更 新 为 345 和 999。 


update phonebook set extensions = 1fst{345.999} where eid = 101:; 加 


在 例 4.3.16 中 谈 到 ORACLE 语法 时 ， 我 们 对 雇员 John Smith 插 人 -个 新 家 属 ， 并 将 家 属 的 
所 有 姓氏 变 为 大 写 。 在 交互 式 的 INFORMIX 中 ， 我 们 不 能 对 集合 元 素 执 行 这 样 的 操作 ; 而 必 
须 写 .一段 过 程 代码 来 完成 上 述 功能 。 我 们 将 在 4.4.2 节 讨论 这 一 问题 。 


4.3.3 汇集 类 型 小 结 


汇集 类 型 和 数据 库 产品 ”我们 看 到 ORACLE 和 INFORMIX 的 汗 ` 集 类 型 比 4.2 节 中 的 用 户 定 
义 类 型 有 更 多 的 差异 。 两 种 产品 都 支持 真正 的 汇集 类 型 ， 即 允许 违反 关系 规则 I 并 且 人 允许 -个 
行 中 的 某 ~- 列 上 出 现任 意 类 型 的 多重 数据 对 蒙 。 二 者 都 充 许 对 转换 为 表 的 形式 的 标量 汇集 值 
的 杏 询 。 除 此 以 外 ， 其 他 都 是 不 同 的 。ORACALE 在 艇 套 表 中 有 一 -个 一 级 汇集 类 增 并 强 要 求 
在 被 转换 为 嵌 套 表 前 有 一 个 二 级 的 VARRAY 汇 集 类 型 。INFORMIX 以 一 种 更 统一 的 方式 米 处 
理 集 合 、 列 表 和 和 多重 集合 ， 并 日 它们 都 可 以 以 TABLEL ) 格 式 来 查询 。ORACLE 不 允许 咎 食 表 
中 出 现 由 套 表 ， 而 INFORMIX 介 许 集 合 中 芍 集合 及 其 他 方式 的 要 套 。OQRACLE 期 望 用 户 命名 
所 有 的 汇集 类 型 ，INEORMHJIX 却 不 对 汇集 类 型 命名 ， 而 是 使 用 诸如 SET (slementtype) 的 
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通用 形式 作为 集合 类 型 描述 符 。ORACLE 通 过 特殊 的 CURSORO 语 法 来 显示 一 个 表 中 的 每 一 
行 的 汇集 中 的 所 有 元 素 ， 而 INFORMIX 不 具有 这 样 的 功能 。 

汇集 和 数据 库 设 计 不 同 产 品 间 的 差异 意味 着 如 果 你 在 数据 库 设 计 中 使 用 汇集 ， 则 将 不 得 
不 费力 地 把 你 的 应 用 程序 从 一 个 产品 物 值 到 另 一 个 产品 。 此 外 ， 在 决定 对 某 种 数据 使 用 汇集 
类 型 时 必须 很 小 心 。 如 在 我 们 研究 过 的 employees 表 中 ， 每 一 行 有 一 个 depentents 标 量 的 
汇集 值 ， 对 十 任何 一 个 单独 的 行 都 可 以 查询 它们 。 然 而 ， 所 有 depentents 的 集合 被 分 解 为 
许多 孤立 的 圾 ， 不 易 操作 。 在 ORACLE 中 ， 我 们 可 以 使 用 表 简 积 来 扩展 一 个 表 以 使 其 包含 每 
个 集合 元 率 的 行 ， 但 INFORMIX 中 没有 相应 的 工具 。 在 两 种 情况 下 ， 我 们 都 必须 通过 父 表 行 
来 访问 汇集 元 泰 。 这 样 ， 对 好 的 数据 库 设 计 来 说 ， 不 把 重要 的 对 象 扫 人 存储 在 汇集 类 型 中 是 
很 重要 的 。 只 和 有 父 表 的 属性 而 没有 独立 的 属性 存储 在 汇集 中 。ORACLE 人 允许 包 仿 REF 的 集合 ， 
INFORMIX 在 将 来 的 版 本 中 也 将 允许 REF 的 出 现 。 这 样 ， 将 来 实际 的 对 象 将 可 以 出 现在 一 -个 
独立 的 对 象 表 中 并 被 其 他 对 象 经 过 REF 在 汇集 值 中 引用 。 

汇集 和 SQL-99 SQL-99 工 作 组 在 汇集 语法 上 播 摆 不 定 。 每 个 新 的 版 本 在 这 方面 都 有 很 大 
的 变化 ， 在 最 终 的 版 本 中 支持 的 汇集 燃 型 只 有 数组 ， 准 备 向 其 他 汇集 类 型 扩展 。 在 SQL-99 最 
新 版 中 的 表 引 用 有 一 种 新 的 格式 UNNEST( )， 其 作用 像 ORACLE 和 INFORMIX 中 的 TABLE( ) 
形式 。 然 向， 数组 并 不 是 Core SQL-99 的 :部 分 。 


4.4 ”过 程 SQL、 用 户 定 义 潜 数 和 方法 


和 月 3.11 节 起 ， 过 程 性 语言 被 当 作 一 组 完成 某 项 任务 的 有 序 指令 代码 椅 成 的 程序 ， 然 而， 非 
过 程 性 语言 ， 如 交互 式 的 SQL 诸 言 ， 要 求 期 望 的 任务 被 一 次 性 地 描述 。 非 过 程 性 在 SQL 被 站 
人 人 时 被 当 作 SQL 的 一 个 比 易 用 性 更 重要 的 特征 来 介绍 。 但 是 , 正如 我 们 在 3.11 节 中 指出 的 那样 ， 
非 过 程 性 语言 缺乏 图 灵机 的 表现 力 【 也 称 为 计算 完整 性 )， 这 意味 着 太 过 程 性 语言 可 能 无 法 完 
成 相当 简单 的 任务 〈 如 按照 大 量 可 能 格式 中 的 其 一 种 方式 打印 客户 报表 )。 

这 个 问题 在 1978 年 Sybase SQL Server 产 品 引 人 了 过 程 性 SQL 语言 ， 称 为 TSQL ( 事务 SQL ) 
时 讨论 到 ， 从 那 时 起 ， 其 他 多 数 的 其 他 厂商 都 在 其 产品 中 引 和 人 了 各 自 的 过 程 性 SQL 语言 ， 如 
INFORMIX 的 SPL 和 和 ORACLE 的 PL/SQL.， 过 程 性 SQL 支 持 内 存 驻 留 变 馆 、 条 件 和 和 御 环 结构 (IF 
… THEN ... ELSE, WHILE 和 FOR )、 过 程 和 清 数 及 在 一 个 程序 中 执行 SQL 语 句 的 能 力 等 。 在 过 
程 性 SQL 中 写 的 精 数 可 以 以 内 部 函数 的 方式 用 在 非 过 程 性 SQL 语 甸 中 ( 如 选择 列表 表达 式 )。 

过 程 性 SQL 在 客户 机 -服务 器 应 用 程序 中 具有 改进 性 能 的 潜力 ， 这 种 应 用 程序 遂 消 用 C 或 
Java 语 言 编写 ， 并 分 别 运 行 在 通常 具有 厅 同 的 处 埋 器 的 客户 机 和 服务 器 上 。SQL 十 名 化 服务 紫 
上 上 执行， 性 能 改进 的 事实 来 源 于 过 程 性 SQL 可 以 像 普 通 的 SQL--… 样 在 服务 器 上 执行 ， 而 不 需 
要 经 常 利 客户 交 开 ， 因 此 减少 了 客户 和 服务 器 间 经 常 变 互 的 时 间 开 销 。 一 个 用 过 程 性 SQL 纺 
罕 的 函数 在 服务 器 上 执行 时 被 称 为 存储 过 程 ， 由 Create Function 语 铝 记录 在 服务 器 上 的 数据 库 
日 录 表 中 ， 即 使 是 隔 数 代码 也 记录 在 目录 表 中 。 因 此 ， 我 们 可 以 说 函数 被 存储 在 服务 器 上 。 
过 程 性 SQL 语 言 在 3QL-99 中 被 标准 化 为 SOQL-99/PSM ( Persistent Stored Module )。 

在 第 ? 章 中 ,我们 将 考虑 一 种 称 为 触发 器 的 机 制 ， 触 发 器 是 可 以 在 任意 事件 (如 插入 行 到 
一 个 表 中 ) 发 生 时 执行 的 过 程 性 SQL 语句 块 。 和 触发 器 用 于 实现 定制 的 约 康 或 缺 省 行为 。 

用 户 定义 函数 (UDF) 是 用 过 程 性 SQL ( 或 用 C 或 Java ) 写 的 函数 ， 可 以 像 交 互 式 SQL 中 
的 内 部 细 数 或 数据 库 系 统 的 过 程 性 SQL 语言 一 样 被 调用 。 一 些 用 户 定 尽 图 数 不 是 对 象 -关系 
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的 ， 就 像 计 算数 字 公 式 一 样 的 简单 .， 而 其 他 可 能 以 对 象 或 汇集 作为 参数 ， 或 从 国 数 中 返回 对 
象 或 汇集 给 调用 者 。 在 本 节 中 ， 我 们 将 讨论 如 何 用 PLASQL (ORACLE) 和 SPL (INFORMIX) 
空 现 UDF. 

方法 是 与 用 户 定义 类 型 一 起 定义 的 用 户 定义 函数 。 由 于 具有 滤 义 方法 的 能 力 ，ORACLE 
对 象 比较 接近 于 面向 对 象 的 编程 语言 中 提供 的 某 种 对 象 。 然 上 看， 我 们 将 看 到 ， 无 方法 的 对 象 
也 是 有 用 的 。INFORMIX 行 对 象 设 有 方法 ， 但 使 用 行 类 型 参数 的 用 户 定 义 函 数 具 有 同样 普遍 
的 能 力 ( 实际 上 各 灵活 )。 我 们 将 介绍 如 何 使 用 INFORMIX 中 的 UDF 提 供 具 有 与 相应 的 
ORACLE 中 提供 的 相同 对 象 操 作 的 行 类 型 。 


4.4.1 ORACLE PL/SQL 过 程 、 用 户 定 义 炒 数 和 方法 


我 们 将 在 下 -小 节 中 简单 介绍 ORACLE PL/SQL ， 然 后 演示 如何 使 用 它 来 实现 UDF 和 方法 
所 需 的 程序 泌 辑 。 希 望 全 曾 了 解 程序 语法 的 读者 可 以 参考 《ORACLE8 PL/SQL User’s Guide 
and Reference } { “ORACLE PL/SQL 上 有 用户 指 南 ?》) 和 《ORACLE Server Application Developer’s 
Guide》( 《ORACLE 服 务 器 应 用 开发 指南 》)， 参 见 本 章 最 后 的 推荐 读物 部 分 。 在 所 面 的 章节 
中 ， 我们 假定 读者 已 经 熟悉 C 语 言 的 一 些 概念 。 

1. PL/SOQL: ORACLE 的 过 程 性 SQL 语言 

PL/SQL 是 交互 式 SQL 的 过 程 化 扩展 。 它 提供 了 一 种 执行 程序 逐 辑 、 上 启明 内 存 案 量 和 执行 
循环 和 茶 件 ， 且 同时 可 以 在 程序 中 的 任何 地 方 使 用 SQL 访问 数据 库 的 方式 。 然 而， 这 里 的 SQL 
诸 句 ， 特 别 是 Selecti 滞 铝 因 查 询 结 果 可 能 必须 作为 内 存 变量 存 伴 而 变 得 复 荣 了 : 一 个 检索 多 行 
的 Select 语 句 不 可 能 仅仅 向 用 户 显示 结果 。PL/SQL 内 存 变量 同样 症 被 用 于 SQL 的 
searchn conditions 中 出 志 的 常 基 的 位 置 。 

一 个 PL/SQL 程 序 块 由 三 部 分 组 成 : 定义 内 存 变量 的 DECLEAR 部 分 ， 紧 跟着 出 现 可 执行 
语 蚀 的 BEGIN-END 部 分 ， 在 所 有 的 执行 语句 之 后 和 END 之 前 可 出 现 第 三 部 分 EXCEPTION 部 
分 。 我 们 将 从 一 个 执行 简单 的 计算 并 将 答案 保存 在 名 为 resu1lt 的 表 中 的 程序 示例 开始 。 


例 4.4.1 写 一 段 PL/SQL 程 序 将 从 1 到 100 的 整数 相 加 。 


decilare 


EL tnteger: -- 10c81 variable without an initial value 
total integer:= NM: -- ocal variable with an 1Nitial value 
begin 
for i im 1..100 loop 
total := total + 1: 
end loop: 
insert into resultftryaluey values (totat)}): -- insert answer into database table 


end; 

你 可 能 输入 这 段 代 码 并 在 SQL*Plus 下 执行 它 ， 像 Create Type 语 句 一 样 ， 必 须 在 其 后 加 一 
个 只 带 / 的 最 后 一 行 。 注 意 这 上 般 程 序 将 执行 并 不 输出 结果 给 用 户 ， 和 但 是 ， 该 程序 的 成 功 执行 将 
输出 信息 “PL/SQL procedure successfully completed.”。 我 们 假定 己 经 建立 了 带 有 单个 整 型 列 
rvalue 的 result 表 。 

例 4.4.1 显 示 了 PL/SQL 的 几 个 重要 特征 。 这 段 程序 块 中 出 现 了 DECLEAR 关 键 子 和 BEGIN、 
BEND 关 键 字 ， 定 义 相应 的 程序 块 的 部 分 。 注 释 与 SQL 的 方式 一 样 ， 以 双 和 更 线 (--) 开 始 。 映 什 操 
作 是 :=， 而 等 号 (=) 用 作 比 较 ， 这 与 标准 的 SQL 相同 。 简 单 的 循环 可 以 用 如 下 的 结构 建立 : 
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FOR counter INM FREYERSEY J]ower_ bound..higher_ bound LOOP 
-- 5equence of statements 
END LOOP 


在 FOR LOOP 和 END LOOP 之 间 是 一 到 多 条 语句 构成 循环 体 ， 每 条 语句 像 C 和 Java 一 样 ， 
以 分 导 结束 。 在 便 4.4.1 中 仅 出 现 了 一 条 赋值 诸 句 。 递 归 过 程 从 按 从 下 界 到 上 界 的 次 序 进 行 ， 
除非 出 吏 表 朱 按 相反 次 序 执行 的 REVERSE 关 键 字 。 

御 环 也 可 以 因 基 种 选 定 条 件 而 结束 ， 而 无 需 到 达 计 数 限制 才 结 率 。 这 样 的 循环 格式 如 下 : 


LONP 
-- seduence of statements 
-- exit loop at any point with: EXIT WHEN condftion: 
END LOOP 
-- flow of control resumes here after EXLIT WHEN occurs within loop 


例如 ， 我 们 可 以 重 写 例 4.4.1 的 程序 如 下 : 


declarep 
1 integer:= 0; -~- local Yariable, with an Tnitial value 
total integer:= 0; -- Jocal variable, with an fnitial value 
begin 
100p 


i :e+ 
total := total + 1; 
exit When 1 >= 100: 
end loop:; 
insert inte resulttrvalyue) values (total}; -- insert answer into database table 
and 


在 执行 上 边 的 程序 后 ， 用 户 可 以 从 result 表 中 选择 来 显示 的 答案 。 这 些 程序 将 只 计算 从 
1 到 100 的 整数 。 一 种 更 灵 话 的 方式 是 将 届 辑 放 在 PL/SQL 揣 数 中 。PL/SQL 阿 数 可 以 像 sqrt( } 和 
substr( ) 一 样 必 为 内 部 函数 使 用 。 

例 4.4,2 写 一 个 PLASQL 末 数 对 和 任意 的 整数 na， 从 1 到 n 的 整数 求 和 。 并 从 SQL 调用 它 。 


cereate function Sum nen integer} return inteder 1 


1 integer; 
tota inteder:= 0; 
hegin 


for i in 1,.m 1oop 
total := total + 1: 
end loop;: 
return #otal: -- return result to SOL or PLASOL calier 


[ejikr : 


这 个 函数 程序 段 的 DECLEAR 部 分 在 Create Function 之 后 ， 没 有 出 现 关 键 字 PECLEAR。 
为 了 在 SQL*Plos 中 运行 必须 让 其 后 加 一 个 只 带 有 /的 新 行 。 如 果 定 多 成 功 ， 则 你 将 看 到 确认 
“Function created.”， 否 则 ， 你 可 以 使 用 SQL+Plus 命 令 : 


show errors 


ORACLE 将 显示 在 编译 时 出 现 的 错误 和 出 现 错误 的 行 导 。 加 


在 形 如 例 4.4.2 的 Create Function 语句 执行 后 ， 据 数 将 像 表 或 视图 一 样 作 为 长 期 对 象 存在 。 
可 被 带 任 意 整 数 表 达 式 的 参数 的 SQL 鸽 句 央 用 ， 途 如 : 


Select sum nl from orders: 
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这 个 选择 语句 很 奇怪 。 它 实际 上 不 使 用 orders 表 一 一 在 这 里 使 用 该 表 仪 仪 是 为 了 满足 一 
个 Select 语 句 应 在 FROM 子 句 中 有 一 个 表 的 语法 要 求 。 然 而 ， 这 个 Select 语 多 将 以 麟 表 的 方式 
返回 多 个 值 。 这 样 ，orders 表 的 每 一 行 中 将 对 应 一 个 值 ， 这 是 一 个 意外 的 结果 ! 为 了 讨论 这 
个 问题 ，ORACLE 提 供 了 一 个 仅 有 一 行 一 列 的 专门 的 表 qua1l。 我 们 可 以 这 样 写 ; 


select sum nelo} froam dual; ~ - Wse Oracle's provided tbTe (Ot tT ] 


当然 ， 我 们 可 以 在 放 人 函数 sum.n 中 的 表达 式 中 使 用 实际 的 列 值 : 


Select qty, sum negqty}, 2*sum_n(tdgty*9ty) from orders where aid = "a0d4": 


这 里 的 sum_n( ) 是 一 个 标量 函数 ， 不 能 与 诸如 sumt ) 和 count ) 的 SQL 集 合 函 数 相 比 。 我 们 
定义 的 函数 sum_nt ) 从 每 一 行 中 到 一 个 值 ， 并 返回 一 个 值 ， 而 集合 晒 数 sumt( ) 扫 描 一 组 值 ， 返 
回 一 个 值 。 上 边 最 后 一 个 Select 语 句 将 对 代理 a04 的 每 个 订单 返回 -一 行 。 

例 4.4.2 介 绍 了 Create Function 语 句 和 RETURN 请 句 。PL/SQL 像 SQL 中 的 命名 列 一 样 { 见 
3.9 节 中 的 “表达 式 、 调 词 和 搜索 条 件 ”) 对 内 存 变量 使 用 同样 的 数据 类 型 语法 ， 并 像 访 问 由 
同 的 内 部 琐 数 ， 如 sqrt( ) 和 substr( )。 附 录 A.3 中 给 出 的 任意 ORACLE 列 类 型 都 可 以 当 作 任 一 程 
序 DECLARE 部 分 的 内 存 变 量 类 型 使 用 。 

从 SQL 调用 的 一 个 函 效 被 假定 不 对 数据 库 作 任何 变动 ; 而 仅仅 计算 -- 个 值 。 在 例 4.4.1 中 ， 
我 们 执行 了 一 个 表 择 人 操作 。 如 果 我 们 在 例 4.4.2 中 有 这 样 的 插 人 ， 而 我 们 试图 从 SOL 语句 调 
用 函数 ， 则 我 们 将 看 到 运行 错误 “Function sum_n does not guarantee not to update database.”。 
当然 ， 我 们 可 以 用 如 下 代码 从 程序 块 执行 好 数 : 


x = SUM NETOO0Y: 


Select 语 句 不 改变 任何 数据 库 中 的 数据 ， 所 以 它 可 以 用 于 SQL 的 函数 调用 语句 中 ， 可 下 面 
的 例子 所 示 。 

例 4.4.3 ” 瑟 一 个 查找 给 定 cid 的 custcmers 表 中 的 cname 和 city， 并 以 诸如 “Tiptop 
{Duluth)” 的 和 客 式 返回 信息 。 


create function namecitytcustid chary return char 1s 
custname chart20); -+ maximum size, gets trimmed back below custcity charit20); 


begin 
select cname, city into custname, custcity from customers where cid = custid: 
return rtrimtcustname? | | “|jrtrimtcustetty) | | 3; -- trim extra space at right 


End; 

注意 在 第 一 行 (custid char 和 return char) 中 为 一 个 字符 品类 型 赋 长 度 是 错误 的 ， 因 为 系统 将 
调整 参数 并 返回 尾 意 长 度 的 值 。 可 以 从 SQL 调用 namecity 苑 数 。 图 

例 4.4.3 使 用 了 返回 单个 行 的 选择 。 通 过 游标 ，PL/SQL 辣 样 可 以 处 理 多 行 的 选择 。 但 这 不 
属于 本 文 的 讨论 范围 。 

在 许多 语言 中 (DC 谱 言 )， 在 范 数 代码 内 可 以 安全 地 改变 参数 变量 ， 央 为 这 些 语言 具有 传 
值 调用 的 方式 ， 即 在 被 调用 冰 数 中 的 参数 仅仅 是 在 调用 语句 中 使 用 的 参数 的 一 个 副本 : 参数 
的 初 值 实际 上 不 会 改变 。 然 而 ， 在 PLASQL 中 ， 参 数 不 是 这 样 的 副本 ， 而 是 函数 调用 中 使 用 的 
实际 的 参数 值 ， 编译 程序 拒绝 试图 改变 它 的 任何 代码 。 如 果 你 试图 改变 在 郴 数 中 代表 参数 的 
变量 ，Create Function 语 名 将 和 失效。 这样 ， 必 须 学 会 在 函数 中 不 用 和 参数 变 基 作为 存储 中 问 计算 
结果 的 地 方 。 例 如 ， 考 虚 下 边 递 增 形 参 x 的 耳 数 : 
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create function incrementix int} return fnt is 


begin 
只 1 -- change %, a parameter varTable **ERROR — HON'T COMPILE** 
Feturm Xx: -- twe should have writtern “return xt+l1™) 

end: 


这 个 函数 导致 ORACLE 错 误 “Function create with compilation error.”， 如 果 试 图 使 用 它 ， 
则 将 看 到 堆 误 “Package or function INCREMENT is in an invalid state."。 

有 一 种 可 以 使 参数 变量 是 可 更 新 的 ， 我 们 可 以 在 Create Function 语 句 中 用 increment {x 
in eut int} 人 代替 increment (x int)。 但 是 ， 不 能 在 任意 SQL 语句 中 使 用 这 一 函数 ， 因 
为 SQL 表达 式 ( 函 数 是 表达 式 的 部 分 } 并 不 支持 改变 数据 。 因 此 ， 如 果 在 DRACLE 的 SQL 语句 中 
使 用 这 样 的 函数 ， 系 统 将 可 更 新 的 参数 解释 为 串 能 改变 它 的 参数 而 返回 -个 不 同 的 错误 信息 。 
与 可 更 新 参数 相对 的 参数 可 用 于 Imnsert 和 Update 语 句 的 值 的 表达 式 和 查询 表达 式 中 。 我 们 对 用 
户 定义 函数 要 习惯 仅 用 只 读 的 参数 ， 以 保证 该 阴 数 对 交互 式 SQL 和 PLISQL 均 可 用 。 

由 于 参数 变量 必须 是 只 读 的 ,我 们 需要 定义 局 部 变量 来 保存 中 间 结 果 和 最 终结 果 。 我 们 
可 以 使 用 对 象 构 造 器 创建 局 部 对 象 ， 如 例 4.4.4 中 的 局 部 变 莲 nper : 

例 4.4.4 ”与 一 个 将 Perscon 上 对 铭 的 age 增加 1 的 函数 。 具 有 参数 x 的 age 增加 1 后 的 返回 
值 返 名 到 局 部 Perscen_t 上 对象 类 型 变量 中 。 


create function Tne_agetperson_ 二 其》 return person_t 本 

nper PEFSBH 二 :一 person_ ttx.ssno, X.phame, xX.a9e): --Clone x to loecal object nper 
begin 

nper .age te XAge + 1; +--change age fn LOCAL YARTABLE, not PARAMETER 

retyurn nper: 


关上 hd : 


这 里 需要 使 用 对 象 构造 器 person_tt) 来 创建 用 于 更 新 的 局 部 对 象 。 我 们 通过 使 用 x 对 象 
的 属性 { 它 的 ssno，pname 和 age) 来 描述 person_t(} 的 所 有 和 参数， 以 使 新 对 象 是 x 的 一 个 
克隆 。 我 们 不 能 仅仅 在 右边 使 用 对 象 构造 器 person_ ttx); 我 们 需要 分 别 指定 这 些 属性 。 研 
值 nper :=x 是 可 行 的 ,但 是 ,在 此 前 必须 调用 构造 器 person_t () 来 创建 nper 变 量 。 

为 使 用 这 个 函数 ， 我 们 显示 更 新 过 年 龄 的 peop1e 表 中 的 所 有 Person 上 对 象 : 

select inc_agetvaluetp})} from peoplée p; 

这 里 的 表 数 据 不 会 被 更 新 ; 增加 操作 仅 影 响 显 示 值 。 为 获得 增加 了 的 年 龄 到 表 中 ， 我 们 
需要 恒 用 下 过 的 Update 语 人 可: 

update people P set p 一 inc_agetvaluetp)) where Pp.age < 0; 

当 我 们 在 任何 表达 式 { 该 Update 语 名 的 SET P= 后 面 的 子 句 ) 中 计算 行 对 象 时 ， 必 须 使 用 
VALUE( ) 的 格式 : value(p)。 但 是 在 等 号 前 的 Update 语 可 中 ， 我 们 使 用 表 的 别名 来 代表 和 需 
要 更 新 的 行 对 象 。 后 

我 们 介绍 的 两 种 FOR 循 环 类 型 如 图 4-29 所 示 。 在 计算 循环 时 ， 德 环 变 量 是 一 个 整 型 变量 (在 
代码 的 开始 声明 )， 它 以 lower_bound 为 初 值 ， 每 次 德 环 增加 1。 直 至 带 有 值 higher_bound 的 循环 
通过 终止。 在 图 4-29 中 ， 我 们 也 介绍 了 新 的 形式 : 下 -THEN-ELSE， 该 形式 可 用 于 PL/SQL 中 。 

2. ORACLE 中 用 PL/SQL 实 现 方法 

方法 是 属于 某 种 对 象 类 型 的 函数 。 对 方法 的 每 次 调用 是 可 以 引用 该 类 型 的 对 象 的 一 次 调 
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用 。 当 程序 执行 到 方法 代码 时 ， 被 引用 的 对 象 简单 地 称 为 seI 上 ， 它 是 一 个 对 象 类 型 变量 。 


FOR counter IN [CREVERSE 了 lower beund,.higher_bound LODP 
- se0uence of statements 
END LOVP 


LO 


- equence of statements 
- exit Toop at any point with: EXIT WHEN condttion: 


END 【LOOP 
- flow of control resumes here after EXIT HHEN occurs within leoop 


IF condition THEN 
statements 
[ELSE 
statements...] 
END IF 





图 4-29 ORACLE PLASQL 中 的 Loop 语句 和 IF 语句 格式 


例 4.4.5 为 点 和 算 形 分 别 定 多 对 过 类 型 point_t 和 和 rectangle_t。 为 rectangle_t 
定义 方法 area{}) 和 inside {point_t})。areal) 方 法 返回 矩形 对 象 的 面积 (不 需要 参数 )， 
inside {point_t) 方 法 用 于 判断 一 个 点 是 省 在 矩形 对 莹 内战 是 在 年 形 对 和 象 的 边 绿卡， 尾 则 
返回 1， 否 则 返回 0 

create type point_t as object 


{ 
X int, “= horizontal coordinate of the point 


¥ int -- vertical coordinate of the point 


create type rectargle +t as object 
‘ 


ptl Peimt +t, -- Jower left-hand corner of rectangite 

pt2 Point_ t+. -- upper right-hand corner of rectangle 

member function insidetp Point 七) -- method to test 1+f poimt is fnsfde rectargle 
return int. -- return 1 1f point inside. else 0 

member function area -- method for area of rectangle 
return int -- rea valLe will always be an integer 


); 
国 


例 4.4.5 中 的 rectangle 上 对 象 包 含 内 两 个 方法 area 和 inside， 它 们 是 该 对 象 类 型 的 
部 分 ， 在 意义 上 与 pt1 和 pt2 属 性 相同 。 方 法 也 称 为 成 页 函数 (Member Functiom)， 这 是 因为 
它们 定 多 的 语法 ,方法 还 没有 提供 任何 代码 执行 必要 的 逻辑 ， 例 如 ， 将 和 握 形 的 长 度 乘 以 宽度 
来 计算 面积 。Create Type 语句 白 身 仅 包 含 可 以 调用 方法 的 代码 所 需 的 信息 ， 这 就 像 C 诛 型 或 
Java 接 口 定 忱 一样， 代码 出 现在 另外 的 独立 的 语句 中 ， 即 便 4.4.8 中 才 出 现 的 Create Type 
Body 诸 名 。 现 在 ， 我 们 看 旬 的 rectangle_c 类 型 的 Create Type 语 句 中 每 个 方法 包含 以 下 声 
明 元 素 : 
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* 方 法 省 : area 和 inside。 

* 方法 的 返回 类 型 : 在 两 个 例子 中 都 为 整 型 。 

“方法 的 参数 : area 没 有 ，inside 有 一 个 命名 为 P 的 Pojint _ + 对 象 。 

如 果 你 不 熟悉 对 象 编程 ， 你 可 能 想 知 道 area 力 数 没 有 参数 是 如 何 能 够 存在 的 。 原 六 是 所 
有 的 方法 都 属于 -个 特定 的 对 象 类 型 ， 且 仅 可 以 使 用 该 燃 型 的 对 象 来 调用 。 这 里 的 area 方 法 
属于 rectangIe tt 类 型 ， 只 能 第 实际 的 rectangle_t 对 象 调 用 。 我 们 可 以 想象 每 一 个 
rectangle _t 对 象 公有 一 个 面积 值 ， 就 像 方法 计算 的 数据 属性 一 样 。 发 现 方法 area 就 像 找 
对 象 pt1 的 属性。 这 样 ， 如 果 rect1l 是 rectangle_t 类 型 的 对 象 ，rect1 .pt 的 值 将 代 潜 
rectl 的 pti 属 性 ， 而 rect1.area{}) 的 值 将 代表 rect1 的 面积 .当然 ，rectl .areat} 的 
值 通过 计算 其 他 局 性 值 的 方法 得 到 ， 介 是， 计算 过 程 对 调用 者 来 说 是 椒 可 见 的 ，area!} 就 像 
对 象 的 属性 。 另 外 ，inside 方 法 用 于 处 理 已 知 一 个 Peint_t 对 象 和 rectangIe_t 对 象 { 如 
PtI) 并 且 想 检验 点 是 否 在 拖 形 中 的 情况 。 因 此 ， 和 矩形 的 inside 方 法 必须 传递 一 个 点 作为 参 
数 ， 它 将 以 rect inside tpt1}) 的 格式 执行 。 


例 4.4.6 创建 point tt 和 rectangle 类 型 的 对 象 束 ， 并 播 人 一 些 值 。 


create table points of point t (primary key (tx. y)}; 

create table rects of rectangle t Corimary key tptl.x, pil.y, pte.x, pt2.y)): 

isert into rectks values 【Point ttl1,2) .point_ td,d4)): 

insert into rects values 【point tl,.1} point tre,6)): 

insert into points values {2,3}; 

insert into points values (C1,d); 

insert into points values {4,4); [| 


我 们 看 到 例 4.4.6 中 方法 的 增加 对 4.2.1 节 介绍 的 创建 对 象 的 能 力 并 没有 任何 改变 。 和 前 边 
一样， 我们 可 以 在 类 型 boinc 《和 rectangle_L 之 外 构造 琢 对 象 并 在 Insert 语 铝 的 VALUES 
的 形式 中 使 用 对 象 构 造 器 point_t |)}) 来 持 入 建立 在 常 量 以 外 的 矩形 或 点 .类似 地 ， 我 们 也 可 
以 在 Select 语 名 中 引用 各 种 局 性 。 但 是 ， 怒 下 例 所 示 ， 我 们 可 以 通过 使 用 方法 area 和 inside 
提供 的 更 多 功能 。 

例 4.4.7 ”我们 从 检索 rects 表 中 所 有 征 形 的 面积 和 判断 点 44,2) 是 否 在 每 个 害 形 中 的 选 
择 查询 开始 。 

Splect valuetx), x.areat) from rects x: 

spelect valuetx)y, x.insidetpoint tid.27) from rects Xx; 


在 图 4-4 中 ， 选 择 列表 中 的 value {x) 以 对 象 构造 器 的 方式 检索 作用 于 rects 的 别名 x 的 
整个 对 象 〈 行 )。 在 第 一 个 查询 中 ，x .area1) 调 用 area 方 法 ， 并 为 rects 中 的 每 … 行 返回 
值 ， 正 如 车 x .pt1 在 选择 列表 中 代替 x .area()}， 则 它 将 被 返回 。 在 第 二 个 查询 中 ， 
x.inside (point_t {4,2)}) 将 以 坐标 为 4 和 2 的 point_t 参 数 调 用 inside 方 法 来 判断 是 否 
该 点 在 别名 为 x 的 rects 的 每 一 行 中 。 

下 边 ， 我 们 写 一 个 查询 来 列 出 points 表 中 在 rects 表 的 基 个 矩形 内 的 所 有 的 点 。 


select distinct px, Py rom points PDP, rects 下 
where r.insidetvaluetp})} » 0; 


这 就 像 写 se1lect distinct value(p}) ... 一 样 ， 但是，DRACLE 不 支持 对 咎 个 对 
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象 的 DISTINCT 处 理 、GROUP BY 和 ORDER BY 语句 ， 除 非 使 用 专门 的 排序 方法 9S 。 当 我 们 
需要 比较 整个 对 象 时 ， 我 们 要 避免 这 种 问题 ，。 
有 一 个 点 b 在 所 有 的 怎 形 中 意味 着 没有 矩形 r 满 足 r.insidaelp)=0， 如 下 面 的 查询 所 未 。 


spelect valuetp)y from points p where not exists 


tselect * from rects r where r.insidetp) = 0); 
最 后 ， 为 了 解释 Update 语 句 ， 我 们 对 所 有 面积 小 于 24 的 气 形 ， 将 x 和 Y 值 都 加 1 来 改变 Pt2。 


update rects r set Pt2 = point tir.pt2.x+]. r.pt2.y+1} 
where r.areat} < 24 


这 里 必须 使 用 表 的 别 和 名， 原因 是 属性 必须 通过 从 表 的 别名 开始 的 点 号 来 引用 的 规则 。 国 


迄今 为 下 所 涉及 的 Create Type 语 句 的 语法 细节 参见 图 4-30。 我 们 已 经 在 4.2.1 节 中 见 过 
Create Type 语句 ， 但 现在 增加 了 MEMBER FUNCTION 语 句 。 


CREATE TYPE typename AS OBJECT 
tattrname datatype {, attrname datatype ...1 
MEMBER FUNCTION mthodname [iparam type {, param type ...}1}] 


RETURN datatype, 
{, MEMBER FUNCTION methodname [ (param type {f. param type ...}}] 
RETURN datatype ..-.}): 





图 4-30 迄今 为 止 所 涉及 的 Create Objcet Type 语句 的 ORACLE 格式 


例 4.4.8 ”为 实现 rectangle_t 对 象 类 型 的 area () 和 inside tponint_t) 方 法 ,我 们 
使 用 一 个 新 的 类 型 语句 Create Type Body 语 何 。 


create type body rectangle t as 


member function area return int 1s -- al logic is in PL7 SOL 
begin 
return (self ,pt2.x-self.ptl.x)*(self. pte,y-self.ptl.y); -- The calculated area 
End 
member function insidetp in poitnt 本 return int is 
begin 
if {px > 一 Self,ptl.x) and (pix < 一 Self,.pt2.x) and -- dnside on x coordinate 
{py = Self.ptl,.y) and 【py 《一 Self ,pte,y) then -- inside on ¥ coordinate 
return 1: -- pis inside rectangle tinciuding the boundary) 
a15e 
return 0: -- Pp is outside rectangle 
end 1f; 
Md: 


end: 


这 个 Create Type Body 语 句 和 前 面 同 种 类 型 的 Create Type 语 名 相关 。rectangle_t 【和 参 
见 例 4.4.5 ) 提供 了 这 里 定义 的 方法 的 实现 代码 。 注 意 这 里 的 内 部 变量 self 是 如 何 被 用 于 代表 
方法 所 操作 的 rectangle_t 类 型 的 对 象 的 ， 而 inside tp in point_t) 则 声明 一 个 由 名 Ep 


旺 ”也 就 是 说 ,我 们 沉 要 定义 一 种 “排序 ”方法 米 告知 系统 如 何 比 较 两 个 对 象 。 参 见 ORACLES Server 
Application Developer's Guide 
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所 引用 的 insiae 方 法 的 类 型 参数 。 

selE 对 象 作为 成 员 了 图 数 的 不 可 见 参 数 而 存在 。 如 前 所 述 ， 参数 是 只 读 的 ，self 也 一 样 。 
当 我 们 需要 以 对 象 来 存储 结果 时 ， 我 们 应 该 创建 局 部 对 象 ， 别 寂 了 创建 新 的 局 部 对 象 葛 调 用 
对 象 构造 器 ， 关 于 对 象 构 造 器 的 用 法 参见 例 4.4.4。 

图 4-31 给 出 了 Create Type Body 二 名 的 语法 细节 。 注 意 可 选 的 DR _ REPLACE 语法 的 使 用 ， 
带 有 这 个 选项 在 再 次 创建 一 个 类 型 之 前 可 以 不 用 Drop Type Body. 


CREATE [OR REPLACE] TYPE BODY type [AS|IS} 
MEMBER FUNCTION methodname Liparam type [Cf{, param type, .-..}])] 
RETURN type 了 5 
BEGIN -- BESIN PL/SOL statements 


implementation statements 
END: -- END PL/ASOL statements 


{MEMBER FUNCTION methodname [Ltparam type [{,. param type,. ...}]]}] 


RETURN type IS 
BEGIN -- BEGIN PLiSQL statements 


上 训 人 全 me 
END: -- END FPL/SOL statements 


+» 





图 4-31 迄今 为 止 所 涉及 的 Create Type Body 语 句 的 ORACLE 格式 


假定 我 们 一 直 在 讨论 的 矩形 表示 地 球 表面 的 区 域 。 我 们 已 经 有 了 大 量 这 样 的 矩形 ， 而 想 
要 找到 覆盖 某 个 给 定 的 点 的 集合 (也 就 是 表 ) 的 面积 最 小 的 短 形 ， 如 图 4-32 所 示 。 





图 4-32 例 4.4.9 点 和 给 形 


例 4.4.9 ”如 果 我 们 只 想 找到 插 盖 每 个 点 的 短 形 的 面积 ( 而 不 需 显 示 这 些 和 矩形 )， 则 只 需 使 
用 下 边 的 语句 : 
select px, py, Mintr.areat}) from rects r, points p 
where r.insidetvaluetp?) > 
group by p.x, Py: 


注意 ， 这 里 的 GROUP BY 子 名 的 每 个 组 中 正好 一 行 。 因 为 坐标 (x, 妇 构 成 主键 然而， 我 
们 仍然 项 要 GROUP BY 子 句 来 保证 最 小 集合 函数 mint( ) 每 次 运行 一 个 点 喧 不 是 整个 点 的 集合 - 
我 们 同样 可 以 使 用 相关 于 查询 对 每 个 点 计算 最 小 面积 的 矩形 并 在 外 层 Select 语 各 中 使 用 它 。 


Select valuetp}, valuerr}, r.areat)}y from rects r, points p 
where r.arealt) = 
(select mintrl.areact}} from rects rl -- minfmal area rectangie... 
Where Tl.insidetvaluetp}) > 0} -<- ,containing 七 he point p 
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ahd rT, insidecvyaluetp)} 
order by PpP.x. py 


外 层 Select 可 能 对 某 些 点 发 现 多 于 一 个 相同 最 小 面积 的 矩形 。ORDER BY 语句 将 这 些 短 形 . 
收集 到 一 起 ， 并 以 一 种 有 用 的 次 序 输 出 所 有 结 宁 。 国 


一 个 纯 对 象 论 者 可 能 会 说 不 直接 引用 对 象 属性 而 只 使 用 方法 来 访问 所 有 对 和 象 的 Select 语 句 
“正好 是 面向 对 象 的 ”参见 4.2.3 节 对 面向 对 象 的 讨论 。 在 这 种 意义 上 ， 例 4.4.9 的 最 后 的 查询 正 
好 是 面向 对 象 的 ， 因 为 仅 在 最 后 的 ORDER BY 语句 中 有 对 对 象 属性 的 直接 引用 ， 并 且 实 际 上 
不 用 这 一 子 句 ， 我 们 也 可 以 得 到 所 有 数据 ”。 在 面向 对 象 术语 中 ， 属 性 被 称 为 是 提供 了 对 象 的 
内 在 表示 ， 不 能 从 对 象 外 直接 访问 。 

然而 ， 在 ORSQL 中 ， 我 们 通常 不 会 限制 自己 通过 方法 来 访问 表 ， 因 为 我 们 目前 所 用 的 查 
询 的 自然 模型 是 知道 表 的 列 和 名 ， 并 使 用 这 些 列 来 搜索 所 需 的 数据 。 由 于 没有 等 价 的 模型 可 以 
创建 并 使 用 户 清楚 可 以 以 通用 的 形式 访问 表 所 必需 的 所 有 方法 ,在 必要 的 时 候 我 们 还 是 继续 
存 有 取 内 部 的 列 。 当 然 ， 我 们 可 以 创建 访问 这 些 列 的 方法 并 提供 话 当 的 面向 对 妾 的 查询 ,但 是 ， 
这 种 直接 由 列 值 到 方法 的 映射 没有 什么 作用 。 

在 本 节 结 束 之 前 的 一 个 练习 将 显示 例 4.4.9 的 查询 可 以 不 用 方法 ， 而 用 交互 式 的 SQL 来 实 
现 ， 但 是 ， 这 样 的 查询 十 分 元 长 而 复杂 。 我 们 为 rectangle_t+ 引 人 的 方法 实际 上 没有 扩展 查 
询 的 功能 的 原因 是 方法 的 逻辑 太 简 单 ， 以 至 于 可 以 用 非 过 程 性 SQL 和 直接 来 表达 。 如 困 我 们 在 
一 个 交互 式 SQL 不 能 复制 的 方法 中 执行 循环 语句 ， 则 这 一 点 是 不 正确 的 。 


例 4.4.10 我 们 展示 如 何 创 建 一 个 对 象 类 型 worGset_t, 它 表 示 词 的 铸 套 表 (如 一 个 关键 
字 集 合 )。 例 4.4.11 的 aocuments 表 中 的 该 类 型 的 一 个 属性 将 使 我 们 可 以 以 集合 中 的 任意 关键 
字 的 于 集合 来 查询 文档 。 


create type Wordtb1 t as table of varchart30); -- nested table type of [key J] Words 
create type wordset t as object 《 -- [keyjnord set object type with methods 
本 心 广 本 wordtbl_t, -- attribute 15 nested table of [keyjwords 
member function wordcount return int, -- return count of words in self object 
member function subsettx in wordset_ t+) return int, -- is self a subset of x? 
member Functior supersettx in wordset_ t} return fnt -- is self a superset of x? 
了 
creaste or replace type body wordset_t as 
member function wordcount return integer is 
begin 
return self,words.count; -- built-in collection method counts words in 
wordset_t 
end: 
member function subsetitx 1n wordset_t) return int 15 
matches int; 1 int; 1 Tnt: 


begin 
for 3 tn 1,.5elf.words,count loop -~ loop through all words in self.words 
matches := 日; 
for j in 1,.xX.words.count loop -- loop through x.words; nested table., 
if self,wordstf) = x.wordstj} then -- rows found by index no， 
-- in PL/SAL 
matches := matches + 1; -- found match, count it 
Bend if: 


合 ”正如 前 面 的 一 个 注释 中 所 刘 的， 通过 定义 rectangle_t 的 “排序 ”方法 我 们 也 可 以 在 QRDER 耻 Y 子 名 中 
司 用 walue tp}。 


1 


冲 4 香 对 穴 - 关 夭 SOL 769 


end loop; -- erd for loop on x.words 
if matches = 0 then 
return 已， -= Self.words not subset of Xx,.words 
end if; 
ENd 1o0p: 
return 1: -- We found all self.words in xX,Words 
end; 
membher function superset. -- similar to Subset {reverse Xx and Self} 
ed 
由 于 篇 幅 的 限制 ， 我 们 没有 给 出 superset1{) 方 法 的 定 尽 。 其 代码 与 我 们 所 见 到 的 
subset () 方 法 的 代码 相似 。 时 


在 例 4.4.10 中 ，wordcount 的 成 员 畏 数 (方法 ) 的 定义 通过 在 表达 式 self .words. 
count 中 使 用 ORACLE 内 部 的 方法 count 来 确定 梧 万 表 对 象 se1l1f .words 的 元 素 个 数 。 和 注意 右 
边 的 “( )” 对 内 部 的 方法 来 说 不 是 必须 的 。 但 不 痊 的 是 ， 这 种 内 部 的 方法 不 能 用 在 交互 式 的 
SQL 中 。 

在 subset 方 法 定义 中 ， 我 们 需要 操作 wordset_t 对 象 中 的 幅 套 表 中 的 元 素 。 在 榜 套 表 
中 的 整个 元 素 集 合 将 被 读 入 内 存 ， 并 以 类 似 数 组 的 结构 提供 给 PL/SQL 人 使用。 元素 被 编 址 为 
self .word {1) ，self .word(2)， 等 等 。 我们 使 用 一 个 对 词 的 外 循环 和 一 个 内 循环 来 计算 
我 们 的 词 与 其 他 wordaset_t 对 得 x 的 词 的 匹配 的 数目 。 如 果 在 第 一 遍 匹 配 时 就 退出 内 循 琳 ， 
则 这 里 的 代码 的 效率 将 更 高 。 

在 第 3 章 的 例 3.11.7 中 ， 我 们 考虑 了 如 和 何 检索 合 有 许多 指定 的 关键 词 的 所 有 文档 的 问题 。 
我 们 可 以 再 次 利用 该 间 题 来 说 明 对 象 关系 的 能 力 。 站 先 ， 我 们 不 再 像 关系 数据 库 中 那 祥 将 文 
档 分 解 为 丙 个 表 ， 而 是 征 必 一 个 包含 每 个 文档 的 关键 字 集 的 奶 套 表 的 documents 表 ; 

合 4.4.11 创建 一 个 对 象 类 型 document_t，document_t 命 有 标识 属性 dociqd、 和 名 字 
docname、 作 者 person_t 和 wordset_t 类 型 的 关键 字 集 合 对 象 属 性 keywords。 创 建 一 个 
对 依 表 documents， 主键 为 4ocidg， 包 合 document_t 类 型 的 对 象 。 

drop table documents: -- drop old table tdepends on type below) 


create or replace type document +t as object-- and old. type, bafore re-creation 


t 


docidint, -= uniSue id of document 
docnamevarchart dd. -- document title 
docauthorperson_t, -= document author 
keynordswordset_t -- keyword set for document 
}: 
treate table documents of document t -- this is the object table of documents 
‘ 
Erimary keytdocid} 
) nested table keywords store as$ keywords_tab; -~ nested table of keywords for 


-= documents 


下 面 我 们 描述 一 个 如 何 使 用 适当 的 关键 词 来 从 documents 表 中 检索 行 的 例子 。 
例 4.4.12 在 上 载 4ocuments 中 的 行 之 后 乒 出 包含 关键 词 boat 的 文档 。 


select docid from documents dd 
where "boat’ in (select * from tabletd,. keywords.words)): 
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第 一 个 查询 不 需要 使 用 我 们 在 例 4.4.10 中 创建 的 方法 。 但 如 果 我 们 要 查询 所 有 文档 中 的 关 
键 词 总 数 。 我 们 可 以 不 用 wordcount1) 方 法 ,但 是 在 ORACLE 的 交互 式 SQL 中 不 使 用 
wordcount {} 方 式 实 现 这 一 任务 是 不 可 能 的 。 


select Sumid,Reywords.wordcountt)y) from documents d: 


例 4.4.13 ”检索 含有 三 个 关键 词 'boat'，'Atlantic' 和 'trip' 的 文档 。 这 需要 使 用 例 4.4.10 中 的 
其 他 方法 。 


select docid, docname from documents d 
where d.keywords.supersetltwordset_ ttwordtbl_t( boat’, Atlantic’,. trip')))»20; 


比较 上 面 的 查询 和 例 3.11.7 中 的 关系 查询 。 上 面 的 表达 式 

wordthbl_tt"boat’. Atlantic'’. 'trip”")} 

是 图 4-22 之 后 介绍 的 艇 套 表 构造 器 。 这 个 表 被 传 给 对 象 构 造 器 wordset_t t)。 最 后 将 被 构造 
的 对 象 与 Superset 方 法 相 比 来 查看 document 对 象 中 的 关键 词 是 否 在 它 的 超 集 中 。 

下 面 我 们 将 显示 刀 何 检索 正好 包含 三 个 关键 词 boat'，'Atlantie' 和 和 "trip' 的 文档 。 我 们 可 能 试 
赂 使 用 where d.keywords=wordset_t{wordtbl_t{'bhoat', 'Atliantic:, 
‘trip')), 但 是 ， 虽然 d .keywords 是 一 个 对 象 ， 简单 的 对 象 间 可 以 比较 ,而 带 集合 的 对 
每 不 能 比较 。 


select docid, docname from documents d 
where d.keywords,supersettwordset_ twordtbl_tt’boat’, ‘Atlantic’, “trip'))}>0 
and dkeywords.subset(wordset twordtbl_tt'boat', Atiantic', ‘trip”}7)>0. 


3, 更 新 方法 

饮 今 为 止 我 们 所 讨论 的 方法 仅 限 于 只 读 的 方法 。 但 是 挟 管 只 读 方 法 很 重要 ， 完 成 更 新 对 
象 的 方法 可 能 比 只 该 的 方法 更 重要 。 写 更 新 方法 的 程序 员 具 有 防 正 这 样 的 更 新 方法 的 负面 影 
啊 的 时 间 和 经 验 ， 然 而 ， 因 为 不 经 意 的 疏忽 无 计划 地 修改 专用 特性 可 能 会 导致 数据 不 一 致 。 
本 节 讨 论 如 何 创 建 更 新 对 象 的 方法 。 

让 我 们 使 用 点 和 矩形 的 例子 来 解释 更 新 方法 。 假 定 我 们 想 要 通过 方法 允许 改变 矩形 的 pt2 
值 来 放大 或 缩小 一 个 矩形 。 我 们 可 以 考虑 对 例 4.4.5 的 rectang1le_t 对 象 类 型 增加 一 个 方法 : 

member function resizetnpte point_t+) return.,.. 

这 里 的 npt2 是 我 们 想 要 为 扎 形 谱 定 的 新 pt2 值 。 注 意 这 种 改变 可 能 导致 一 个 无 效 的 矩 
形 ， 即 它 的 右上 前 可 能 低 于 或 在 左下 角 的 左 部 。 因 此 ， 我 们 必须 在 方法 的 代码 中 肪 止 出 现 
这 种 可 能 性 。 

在 例 4.4.3 后 曾 的 讨论 中 ， 我们 指出 如 果 一 个 函数 可 被 用 于 SQL 语 句 中 ， 那 么 该 函数 不 能 
修改 它 的 尾 何 参数 。 由 于 同样 的 原因 ， 方 法 也 不 能 改变 它们 的 se1l1f 的 对 每。resize[{) 方 法 
附加 于 rectangle_t 对 象 ， 并 且 不 能 改变 sel1f 对 象 意味 着 在 返回 结果 给 调用 者 的 通信 过 程 
中 我 们 需要 返回 一 个 rectangle 七 类 型 的 对 象 。 我 们 将 在 例 4.4.14 显 示 这 一 过 程 。 


例 4.4.14 实现 上 面 讨论 的 resize 方 法 。 下 面 是 rectangle_t 的 Create 或 Replace Type 
Body 语 人 句 的 部 分 。 


member function resizetp point_t) return rectangle_t is 


Tp i 
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newrect rectangle_t := $elf; -- clone self to local object 
begin 
if px > self,ptl.x and py > self.ptl.y then -- check new rectangle TS valid 
newrect .pt2 := Pi; -- OK, update pt2 for return rectangie 
end i; 


return NEwrect: -- No change if pte was it1legal 


end: 


注意 在 例 4.4.14 中 我 们 是 如 何 克 隆 一 个 self 和 矩形 到 局 部 变量 newrect 中 的 。 这 个 局 部 变 
量 可 以 被 改变 ， 然 后 冉 返 回答 想 知 道 新 竹 形 的 调用 者 。 如 果 带 有 pt2 等 于 p 的 新 矩形 不 是 有 效 
的 十 形 ， 则 原来 的 矩形 值 将 被 运 间 ， 

例 4.4.15 若 改 变 有 效 ， 则 显示 将 rects 中 pt2 改 变 为 新 坐标 {10, 10) 的 所 有 和 气 形 ， 假 设 
这 是 有 效 的 定形 形式 ; 否则 ， 人 保留 矩形 的 当前 形式 。 


select r.resizetpoint 二 (10.10)7 from rects r; -~ di1splay tresized rectangles 
图 


在 例 4.4.15 中 ，rects 中 实际 上 没有 矩形 被 改变 ， 因 为 我 们 仅仅 显示 由 resize 返 回 的 值 。 
但 是 ， 我们 当然 是 要 使 用 resize{) 来 改变 数据 库 中 的 值 ， 那 么 需 将 改变 后 的 矩形 放 在 
Update 语 句 中 的 SET 子 句 中 。 

例 4.4.16 ”对 rects 中 的 所 有 pt1 在 (2, 1) 位 置 的 矩形 应 用 重 定义 天 小 的 操作 将 pt2 .x 和 
pt2 .y 都 增加 1。 


update rects r 
set rer.resizetpoint ttr.pt2a.x + Tor.pt2-y + 1)) 
where rptl = Point tt2.1): 


4.4.2 INFORMIX 中 的 用 户 定义 函数 


INFORMIX 没 有 对 象 方法 ， 属 于 对 象 类 型 的 苹 数 被 自动 定 尽 作用 于 该 类型 的 对 象 ， 但 是 
用 户 定义 了 泪 数 有 同样 的 表现 力 且 灵活 性 要 大 一 点 。 我 们 将 在 INFORMIX 的 过 程 性 语言 SPL 中 
观察 用 户 定义 函数 ，SPL 与 ORCACLE 的 PLASQL 非 常 相 似 。 我 们 将 在 后 面 介 绍 SPL 的 语法 。 本 
节 后 面 的 图 4-35 总 结 了 SPL 和 PLASQGEL 的 基本 诸 靶 成 分 。 关 于 详 言 的 唱和 驳 信 息 可 以 参考 
CINFORMIX Guide to SQL Tutoial》( 参见 本 章 末 尾 的 “推荐 读物 ”)。 

1. SPL: INFORMIX 的 过 程 性 SQL 语 言 

在 过 程 性 含义 上 讲 ，SPL 是 交互 式 SQL 的 扩展 ， 它 提供 了 在 阔 数 或 过 程 中 实现 过 程 塑 辑 的 
万 式 。 像 DRCACLE 的 PLASQL 一 样 ，SPL 编程 包括 声明 内 存 变 量 和 实现 循环 和 条 件 的 执行 ; 
在 任意 时 刻 SQL 可 被 用 来 访问 数据 库 。 

在 SPL 中 ， 所 有 的 代码 包含 在 一 个 函数 【或 过 程 ) 中 。SPL 不 支持 ORACLE 例 4.4.1 那 样 的 
独立 的 代码 块 。 每 个 消 数 以 CREATE FUNCTION 开 始 以 END FUNCTION 结 束 并 且 由 代码 块 组 
成 。 一 个 SPL 代 码 块 从 声明 内 存 变量 的 一 系列 DEFINE 开 始 ， 紧 跟着 一 系列 可 执行 的 语句 
DEFINE 语 句 不 能 出 现在 任何 可 执行 语句 的 后 面 。 整 个 代码 块 被 CREATE FUNCTION/END 
FUNCTION 或 BEGIN/END 对 包围 。 在 一 个 块 内 定义 的 变量 不 能 被 这 个 块 外 的 程序 访问 。 也 就 
是 说 ， 整 个 耳 数 定义 像 一 个 隐 舍 的 代码 块 一 样 ， 但 我 们 可 以 在 其 中 创建 语句 块 来 定义 内 存 变 
量 。 我 们 从 一 个 完成 简单 运算 的 函数 开始 对 此 进行 说 明 。 


-Tr 一 
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例 4.4.17 用 SPL 写 一 个 累加 1 到 "的 整数 的 函数 ，m 为 任意 整数 . 


create unmetion sum _ nen inty returning int; 
deftine 1 tnt; 
define total Tnt: 


let total = 0: 
for i= 1 ton 
let total :w= total + 于 
end for: 
returr total; -=- return result to SOL or SPL caller 


end functtion: 


如 年 义 有 和 错 ， 则 系统 将 昌 动 显示 带 行 吕 的 编译 错误 。 我 们 可 以 使 用 下 边 的 INFORMIX 
SQL 语句 来 执行 上 面 的 函数 : 

execute function sum ntl1d}; 

我 们 也 可 以 在 任何 SQL 语句 中 使 用 这 个 函数 : 

SElECt Sum _ mt1IO+ from orders; 

然而 ， 这 个 Select 语 句 将 以 列 的 形式 返回 多 个 什 1 对 应 orders 中 的 每 一 行将 有 一 个 值 。 
显然 在 INEFORMIX 中 这 不 是 预期 的 结果 。 当 我 们 并 不 想 返 加 多 个 值 的 时 候 ， 我 们 仅仅 使 用 上 
边 的 Execute 博 汝 |。 当然 ， 我 们 可 以 在 函数 sum_n 中 使 用 实际 的 列 值 : 


select qty, sum niqty), 2*sum niqty*qty)y from orders Where aid = ' a0d4": 


汗 意 sum_n{) 是 一 个 标量 明 数 ， 不 能 与 诸如 sum( ) 和 count( ) 这 样 的 SOL 集合 函 数 相 比 。 国 


例 4.4.17 显 示 了 SPL 的 几 个 重要 的 特点 。 我 们 看 到 关键 字 CREATE FUNCTION 和 和 END 
FUNCTION 限 制程 序 抉 的 界限 。 注 释 以 双 短 线 (--) 开 始 。 赋 值 语 旬 形 如 1 et 
target-=expression， 不 同 于 PL/SQL 中 的 target : =expression。SPL 对 内 存 变 量 使 
用 与 SQL 对 命名 列 上 所 用 的 同样 的 数据 类 型 语法 ( 参见 3.9 第 中 的 讨论 )， 并 访问 同样 的 内 部 薄 数 
如 sqrtf ) 和 substringt )。 

在 一 个 像 例 4.4.17 那 样 的 Create Funetion 语 名 执行 后 ， 函 数 将 成 为 如 表 或 视图 那样 的 一 个 
长 期 存在 的 模式 对 象 。Create Function 语 人 馈 的 一 般 形 式 如 图 4-33 所 示 。 

CREATE FUNCTION funtionname (Cparam IL{, param .. .1]]) RETURHING datatype; 


statements 


end functions: 





param :: = paramname datatyne 


图 4-33 INFORMIX 用 户 函 数 的 SPL 语 法 到 现在 所 涉及 的 ) 
一 个 简单 的 循环 可 以 用 如 下 语法 设 定 : 


FOR edunter = lower bound TO higher bound [STEP incraement] 
-- Sequence of statements 
~-- exit 1oop at any point with EXIT FOR condition 
END FOR: 
-- flow of control resumes here after EXIT FOR occurs withir 199 


在 FOR 和 END FOR 之 间 是 一 到 多 条 语 各 构成 的 循环 体 ; 每 个 语句 像 C 和 Java 一 样 以 分 号 结 
桌 。 在 例 4.4.17 中 仅 出 现 了 一 条 语句 。 递 归 过 程 从 控 从 小 到 大 的 次 序 从 第 一 个 界限 到 后 一 个 界 
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上限 ， 即 便 STEP 说 增值 为 负 时 也 如 此 。 如 for 10 to 1 step -1。 
循环 也 可 以 因 任意 府 定 条 件 而 结束 ， 而 无 需 到 达 计 数 限制 ， 一 种 不 同 的 循环 形式 如 下 : 


WHILE condition 
~- SegquUENnce oFf Statements 
-- exit loop at any point with; EXIT WHILE condition: 
END WHILE : 
filow of control resumes here after EXIT WHILE occurs within loop 


例如 ， 我 们 可 以 重 写 例 4.4.1 的 程序 如 下 ，; 


Create function sum_n2tn inty returning int: 

define i1 integer: 

define total integer; 

iet 1 一 站 

let total = D0; 

while TRUE -- could 1nstead write while 1 <~m hh 
Tet total := total + 1; 
let 1 := 1 + 1: 


exit while 1 > n; -- Exit while clause 
end while; 
delete from result; -- delete all old rows from database table 
insert 1nta result trvalue} values ftotal): -- nsert answer into a database 
- table 


end functian: 


在 执行 上 面 的 函数 后 ， 用 户 可 以 从 result 表 中 选择 来 决定 结果 或 使 用 Execute 语 句 显 未 
结果 。 本 节 林 尾 的 图 4-35 绽 出 了 INFORMIX 和 和 ORACLE 的 各 种 编程 结构 ， 包 括 循环 语 急 语法 。 

上 面 定 头 的 第 二 个 旺 数 som_n2( ) 不 能 被 SQL 成 功 调 用 ， 尽 管 使 用 Execute Function 可 以 很 
好 地 运行 。 相 反 ， 从 SQIL 使 用 它 将 产生 错误 “Tllegal SQL statement in stored procedure.”。 这 
里 的 非法 语句 是 措 Insert 语 句 。 和 和 ORACLE 一 样 。 在 INFORMIX 中 ， 由 SQL 亩 用 的 耳 数 不 能 履 
上 变数 据 库 中 的 数据 ， 因 为 SQL 中 的 洋 数 调用 被 当 作 表达 式 (仅仅 从 其 他 什 来 计算 一 个 值 )。 

由 于 Select 语 名 不 改变 数据 库 中 的 数据 ， 因 此 可 以 用 在 一 个 SQL 可 调用 的 函数 中 ， 如 下 
例 所 示 。 


例 4.4.18 写 一 个 查找 欠 定 cid 的 customergs 表 中 的 cname 和 city 并 以 诸如 
“TiptopCDuluth)” 的 格式 字符 串 返 回信 息 的 师 数 。 


create function namecitytcustid chart10})) returning chart20Y 


custname chart203: -- Mmake local string big enough (tit gets trimmed below) 
custcecity char(20}.: 
begin 
select cname, city Thto custrname, custcity from customers where cid = custid: 
return trimtcustname) || (| | trimcustcityy || '}': -- trim extra spaces off 
end: 
这 个 函数 可 以 从 SQL 以 sum_n ( ) 同 样 的 方式 调用 。 加 


和 例 4.4.18 中 使 用 了 返回 单个 行 的 Select。 和 通过 游标 ，PL/SQL 同 样 可 以 处 理 多 行 的 选择 ， 本 
文 不 做 介绍 。 
在 诸如 C 的 许多 语言 中 ， 在 孙 数 代码 内 可 以 安全 地 改变 任何 参数 变量 ， 因 为 这 些 语 讶 具有 
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传 值 调 用 的 方式 ， 即 在 被 调用 函数 中 的 参数 仅仅 是 在 调用 诸 句 中 使 用 的 参数 的 一 个 副本 : 任 
何 参 数 变 量 的 初 值 实际 上 不 会 改变 。 尽 管 SPL 使 用 传 值 调用 ,但 具有 模糊 的 关于 什么 时 候 参 数 
恋 基 可 以 用 于 RETURN 滞 名 中 的 代码 规则 。 最 安全 的 方式 是 像 PLASQL 一样 用 SPL 中 使 用 引用 
调用 的 方式 。 这 意味 着 我 们 应 该 在 计算 返回 值 时 避免 改变 参数 变量 并 创建 新 的 局 部 变量 ， 这 
样 可 以 傍 正 打破 SPL 中 关于 返回 值 的 特殊 代码 规 财 。 这 里 有 一 个 改变 变 参 来 打 殴 我 们 的 规则 的 
例子 (尽管 SPL 对 违反 该 规则 的 惩罚 仅 是 返回 更 新 后 的 值 )。 


例 4.4.19 写 一 个 更 新 某 个 参数 的 消 数 。 


treaate function x_outts varchar(80)} returntng varchartdo:; 
let 5S[1.3] = XXX's: -- charnge the parameter **DON'T DO THIS1!** 
return s; -- return updated parameter variable 


全 Ph 村 : 


注意 ， 这 里 使 用 的 INFORMIX 子 串 的 语法 是 3.9 节 的 图 3-18 后 面 提 到 的。 这 里 s[1,3] 表 
示 从 位 置 1 到 3 的 子 串 。 这 个 函数 将 被 成 功 地 编译 并 可 用 于 Execute Funection 或 更 复 当 的 SQL 
再 用 。 

select x_outrename}y from customers: 

然而 ，x_out {) 函数 更 新 了 参数 变量 ， 违反 了 我 们 的 代码 规则 ， 因 此 我 们 应 将 其 重 写 为 
使 用 局 部 变量 的 更 新 语句 ， 


Create FUNCtion RX_outts varchartborYy returning Yarchart(ddys 


define newstr varchartao0}: 


let newstr = $5; -- clone parameter string to local variable newstr 
let mewstrrl 3] = ‘XXX’; -+ Change newstr"s first three chars to “XxX” 
return newstr: -- Faturn updated LOCAL string 


nd: 


注意 ，SPL 编 译 程序 并 不 报告 违反 了 返回 参数 的 代码 规则 ， 但 是 结果 函数 可 能 有 时 正确 ， 
有 时 不 正确 。 为 了 保证 安全 性 ， 我 们 将 只 改变 局 部 变量 ， 就 像 我 们 在 PL7SQL 中 所 做 的 那样 。 

我 们 经 常 需要 定义 局 部 变量 来 保存 中 间 和 最 终结 果 。 我 们 可 以 使 用 行 构造 器 生成 一 个 局 
部 行 类 型 ， 如 同 我 们 在 例 4.4.20 中 看 到 的 的 局 部 变量 nper， 类 似 的 例子 见 例 4.4.4。 


例 4.4.20 ” 写 一 个 将 person_t 对 象 的 age 增 加 1 的 蚂 数 。 具有 参数 x 的 age 增 加 1 后 的 返 
回 值 返回 到 局 部 person_t 对 象 类 型 变量 中 。 


create functfon inc_agetx person tt) returning person t; 


define nper person + "= local variable nper 
1et nper ™ Casttrow( xX.ssno, Xpname, xX.age) as person 二) -- clone x to nper 

let nper.ade = ge + 1: "= Change 3ge 

return nper: -= Feturn local nper 


end; 

这 里 需要 创建 一 个 局 部 行 类 型 变量 nper 来 用 于 逐 辑 的 改变 。 我 们 通过 在 第 二 行 中 使 用 x 对 
象 的 字段 《 它 的 ssno，pname 和 age 字段 ) 来 指定 行 构造 器 的 所 有 参数 。 因 此 新 的 局 部 变量 
是 x 的 克隆 。 不 幸 的 是 , row(x) 并 不 起 作用 ; 我 们 需要 单独 捞 述 字段 。 赋 值 nper :=x 是 可 行 的 ， 
但 是 ， 预 先 调用 构造 器 row( ) 来 生成 变量 nper 仍 是 必需 的 。 整 个 函数 体 十 分 简单 ， 可 以 仅 用 
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一 行 表 示 如 下 : 


raturn castirowtx.ssno. Xx.pname, xX.aget+l}) as person_t): -- construct and return 


为 使 用 这 个 函数 ， 我 们 显示 饥 新 过 年 龄 的 人 中 的 所 有 person_t 对 象 ; 


select inc agatp}y from People p: 


这 里 没有 表 的 数据 被 更 新 ; 增加 操作 仅 影 响 显 示 值 。 为 了 更 新 表 中 数据 ， 我 们 需要 使 用 
Update 语 句 。 然 而 ， 在 INFORMIX 中 ， 我 们 不 能 一 次 性 地 更 新 整 行 对 象 ， 因 此 ， 我们 不 能 给 
出 使 用 inc_age) 末 更 新 People 并 的 简单 例子 ; 而 是 要 更 新 其 作为 列 的 每 一 个 字段 


(ssno, pname, age ), 面 


2. 在 INFORMIX 中 使 用 SPL 实现 UDF 
像 DRACLE 例 4.4.5 一 样 来 实现 点 和 矩形 的 用 户 定 内 函 数 areatl) 和 insidqe(t)。 由 于 这 些 
不 是 方法 ， 我 们 需要 用 显 式 的 矩形 参数 来 调用 他 们 。 对 一 个 矩形 < 和 点 PP 的 参数 调用 是 


area fr) 和 jineiae(L，Ppios 


例 4.4.21 我 们 创建 INFORMIX 行 类 型 point_t 和 rectangle_t， 再 实现 用 户 定 义 函 数 
area{r)} 和 inside{r, p}。 


drop function area: 
drop function inside: 
drop row type rectangle t+ restrict; -- Note we must droap ohbjects depending... 
drop row type potnt_t restrict: -~ .on these types before dropping the types 
create row type point t 
t 
x nt -- horizontal coordinate of point 
¥ tnt -- vertical caordinate 
}: 
create row type rectangie t 
‘ 
ptl point_t, -- point at lower left-hand corner of rectangle 
pt2 Point t ~ point at upper right-hand corner of rectangle 
}; 


create function aree tr rectang1e t) returnfng int: 
return tr.pta.x-r ptl,xI*ir pt. yr.ptly}): -- area of rectangle r 
end function: 


create functionr inside (tr rectangie +t, p point t}) returring boolean: 
if (px Ym rptl x} and (PAX Ce Fpt2.x) and fpoy Y= rptl.yy and fp.yY Co Fpt2.y) 


then return “七 ; -- return True ff p inside r 
B15e 

return "f°, ~-- return False 1f p not insitde 上 
end if: 


end function: 

可 以 看 到 ，SPL 创 建 UDF 的 语法 与 ORACLE PL/SQL 定 义 方 法 的 Create Type Body 语 句 
的 语法 十 分 接近 ， 该 语句 定义 方法 代码 。INFORMIX 支 持 inside 返 回 值 为 布尔 类 型 ， 这 使 得 
查询 更 好 一 些 。 国 

例 4.4.22 为 点 种 和 盾 形 创建 类 型 表 ， 并 播 信 一些 值 。 


insert into rects yalues icasttrowt1l,.2) as Pofnt t),castirowt3,4) as point_t)): 
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THSert into rects values (casttrow(tl1,.1) as potnt 七) ,castirow(6,.6) as point t)}: 
insert into points vealues (2,3):; 
insert inte points values (1,4}: 
insert into points values (dd,.4)}: 


为 验证 所 做 的 工作 ,书写 简 单 的 查询 来 计算 每 个 和 矩 形 的 面积 并 检查 点 (4, 2) 是 否 在 每 个 
和 矩形 中 。 


select arealtx}y from rects Xx: 
setect inside(tx ,casttrowtd4,2) as Point_ t)} from rects 其 


结果 证 明 是 对 的 。 国 

INFORMIX Create Function 语 法 如 图 4-33 所 示 ， 本 上 季 末 尾 的 图 4-35 给 出 了 我 们 在 
INFORMIX 和 ORACLE 中 使 用 的 各 种 编程 构造 器 。 

现在 ， 我 们 来 考虑 DRACLE 中 例 4.4.10 中 介绍 的 关键 字 和 文档 的 例 于 。 这 个 例子 很 重要 ， 
因为 INFORMIX 缺 乏 ORACLE 中 的 交互 式 SQL 使 用 游标 来 跨越 一 个 表 的 多 行 的 汇集 或 插 人 更 
新 汇集 中 的 单个 元 素 的 能 力 。 但 是 ， 通 过 使 用 SPL 画 数 ， 我 们 可 以 逐个 元 素 地 搜索 多 行 汇集 并 
改变 其 中 的 元 素 。 

像 例 4.4.10 的 方法 一 样 ， 我 们 通过 创建 实现 子 集 操作 的 用 户 定义 盟 数 开始 。 这 里 ， 我 们 不 
需要 词 计数 函数 ， 因 为 INFORMIX 提供 了 CARDINALITYI( ) 作 为 集合 的 内 部 函数 。 我 们 也 不 需 
要 超 集 (superset) 探 作 ， 因 为 我 们 的 UDPF 没 有 隐 含 由 被 sel1i 引 用 的 一 或 两 个 参数 决定 的 次 序 。 


例 4.4.23 ”对 varcharf30) 元 素 集 人 台 写 一 个 用 户 定 多 图 数 subset (waset1， waset2) ， 
若 wdset1 是 waset2 的 一 个 子 集 ， 则 返回 真 (TRUE)。 


create function subsetiwdsetl set{varchartd0) net null}, 
mdset2 setrivarchart30) not null}y) returning boolean: 


define matchcnt int; -- 1ocal variable for count of word matchent 

define wdl varchar(30}; -- loca] variable for word from wdsetl 

define wdz varchart30):; -- ocal variable for word from wdsete 

foreach cursorl for -- loop through elements of wdsetl; see Fig. 二. 34 
celect * into wdl from tabletwdsetl) -- select 1 element at a time from Cursorl 
let matchcnt = 0; -- initiatizs count of matchent for wdl in wdsetz 
foreach curstr2 for -- Toop through elements of wdset? 


select * into wd? from table(wdset2) 
if 【WwWd2 == wdl) then 
let matchent = matchent + 1:; -: count match of wdl in wdsete2 
end ff: 
end foreach: 
if tmatcthente=d) then 


return “二 -- this wdl not in wdset?2, fafi 
tnd if} 
end foreacth; 
return ‘t": - 1] wdsetl Words were found in wdset2 


end functiors: 


图 4-34 显 示 了 用 在 例 4.4.23 中 的 汇集 循环 的 语法 。 为 使 用 它 ， 我 们 必须 定义 汇集 元 素 型 参 
数 的 局 部 变量 【在 图 4-34 中 被 称 为 element_wvar ) 并 在 将 collection_var 参 数 转 换 为 表 
的 选择 语句 Select Into 中 使 用 它 。 在 对 汇集 元 素 的 每 一 次 循环 中 ，Select Inte 将 来 目下 一 个 汇 
集 元 素 填 充 到 元 素 变量 中 。 
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FOREACH eursorname FOR 
SELECT * INTO eTement var FROM TABLEcolTlection var) 


statements 
END FOREACH: 





图 4-34 江 集 变量 的 游标 循环 的 INFORMIX SPL 语 法 


在 例 4.4.11 中 ， 我 们 定义 了 在 检索 所 有 上 共有 许多 指定 关键 字 的 文档 的 ORACLE 查询 中 所 需 
的 aocuments 表 。 在 例 4.4.24 中 ， 我 们 娄 似 好 定义 了 一 个 对 每 个 文档 包含 关键 字 集 人 台 的 名 为 
documents 的 JINFORMIX 表 。 


例 4.4.24 创建 一 个 行 类 型 document_t，document_t 含 有 和 标识 符 docid、 艾 档 名 
docname、 作 者 person_t 和 keywords 集 合 varchar(30)， 创建 一 个 类 型 为 document_t 的 
类 型 表 documents。 


drop table decuments: 

drop row type document 4 restrict; -- all objects dependent on type must be dropped 
create row type document 七 

t 


dacid int ， -= Unidque id of document 
docname varthartdd). -* document title 

docauther person_t, -= document author 

keywords set Cvarchartd0) not null) -~ keyword set for document 


}; 
treate table documents SF document t 
t 

primary Keytdoctdy 


例 4.4.25 ”上载 一 些 行 后 ， 找 出 带 关 键 词 heat' 的 文档 。 


select docid from documents 


where "boat’ in Keywords: ~-" note IN doesnt require a Subquery in INFORMIX 
和 例 4.4.12 一 尽 ， 这 个 查询 根本 不 需要 任何 函数 。 我 们 的 下 一 :个 目标 是 检索 所 有 文档 的 关 
键 词 总 数 。 


select sumtcardinalityikeywords}) from documets: 


例 4.4.26 检索 带 所 有 关键 词 boat，'Atlantic' 和 'trip' 的 文档 。 


se lect doctd, docname from documents 
where subsettisetf’boat', Atiantic’ ,trip’}, keywords}:; 


下 边 , 我 们 查询 正好 带 有 三 个 关键 词 'boat'，'Atlantic' 和 'trip' 的 文档 。 对 此 ,在 ORACLE 中 ， 
我 们 可 能 需要 检查 子 集 和 超 集 ， 因 为 PLASQL 不 支持 对 答 套 表 的 等 价 测试 。 但 是 ，INFORMIX 
支持 对 集合 的 等 价 测试 ， 因 此 ， 我 们 有 如 下 的 简单 查询 : 


select docid, doucname from documents d 
where d.keywords = set{f'boat’ Atlantic’ “rip 
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假定 我 们 创建 一 个 resuests 表 ， 其 中 的 每 一 行 有 一 个 类 型 为 SET of varchar{30) 
名 为 wds 的 询 ， 包 含 一 个 要 在 一 些 文档 中 查找 的 关键 词 集合 和 --- 个 整 型 的 ID reqia。 于 面 的 
Seltect 语 句 将 文档 与 请 求 相 匹配 ， 


selert d.docid, r.regid from documents d, requests r 


where subsetitr.wds, d.keywords}): 
一 个 会 有 许多 关键 词 的 文档 可 能 被 许 窗 请 求 发 现 。 为 了 更 具有 选择 性 ， 我 们 可 以 对 每 个 
查询 要 求 报告 上 共有 所 有 的 关键 词 的 文档 和 最 小 关键 词 总 数 的 文档 。 
select d.docitg, FF.regid, cardinalitytd. keywordsy from documents dd, requests T 


where cardinalitytd. keywords} = 
(select mintcardinalitytdl keywords}} from documsnts dl 
where subsettr, wdts, dl.Keywords)} nd subsettr .wds, d.keywords}; 


3. 更 新 函 教 
用 户 定 多 肖 数 提供 了 在 INFORMIX 中 改变 汇集 中 的 单个 元 素 的 唯一 方式 。 和 和 ORACLE 一 
样 ， 我 们 可 以 创建 返回 更 新 后 的 汇集 的 函数 ， 也 可 以 使 用 它们 改变 该 数据 类 型 的 任 一 列 。 


例 4.4.27 写 一 个 增加 一 个 词 到 varchar(30) 类 型 的 词 集合 的 晒 数 addword， 该 明 数 巡回 一 
个 增加 了 闻 的 新 集合 。 


create function addword{wdset settyvarchart30) not nell},. wd varchart30}} 
returning set(tvarchartdd) not nully:; 


define newset settvarchart30} not nully): 
let newset = Wiset; -- Clone parameter set For return vatue 


insert into tabiernewset) values {wd -= dd iew element 
总 


end Function: 
国 


例 4.4.28 合用 addword 增 加 bird 到 documents 表 中 dociqd 为 200 的 文档 的 关键 词 列表 中 。 


update documents set keywords = ddword(ikeynords,. bird’) 
where docid = 200: | 


类 似 地 ， 我 们 可 以 写 一 个 将 一 个 词 集合 加 入 到 某 些 文档 的 关键 词 集 合 中 的 函数 。 然 三 ， 
我 们 需要 一 个 扫描 插 人 集合 的 游标 ， 可 以 将 每 个 元 素 插入 到 扩展 集合 中 ， 

例 4.4.29 写 一 个 删除 varchar(30) 类 型 的 词 集合 中 的 指定 词 的 图 数 delword， 该 函数 返回 
一 个 减少 了 的 词 的 新 集合 。 


create function delwordtwdset seteyarchart 0 not nully,wd varchardt dd}y 
returning setivarchart30) not null}; 
define wdl varchartad).: -- for Select into use jn cursor 


defFfine Newstet setivarchartdtd) not nvlli: 


let newset w= wdset; -= tlone set for return value 

foreach curserl] for "= scan set, Tooking for wd to delete 
select * into wdl from tabletnewset) 
if wdl = wd then -- found wd. delete it 


delete from tabletnewsety where current of cursorl: 
exit foreach: -- only one to delete, $0 leave 100p now 
end 和: 
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end foreach: 


return Newset-: -- return set, possibly one element smalier 
end function:; | 


注意 这 里 的 SPL 语 句 格 式 ，; 


delete from tableftwdsety where current of cursorl: 


deljword{ 1 了 数 和 addword( | 的 方式 类 位， 
4.4.3 用 户 定义 阔 数 小 结 


我 们 已 经 研究 了 ORACLE 的 方法 和 INFORMIX 的 用 户 定 义 丽 数 即 UDFE。 实 际 上 ， 
ORACLE 的 方法 是 一 种 用 户 定 义 蝶 数 UPF 类 型 ， 并 且 ORACLE 支 持 用 PLASQL 或 C 这 样 的 语言 
写 的 非 方法 的 UDPF. 这 样 , 我 们 在 ORACLE 中 可 以 将 subsetf ) 作 为 一 个 单独 的 UDF 消 数 米 实现 ， 
并 像 INFORMIX-- 样 用 subsetfsI, s2) 来 调用 它 。 

PL/SQL 和 SPL 具 有 如 下 相似 性 (两 种 语言 元 素 的 比较 如 图 4-35 ); 

= 数据 类 型 在 Create Type 或 Create Row Type 语句 中 指定 。 

"算术 运算 与 交互 式 SQL 一 样 。 

“点 对 被 用 于 访问 属性 /字段 。 

。 对 象 / 行 类 型 的 局 部 变量 在 使 用 前 需 用 对 和 象 / 行 构造 器 (或 一 条 Select Into 语 句 ) 初 始 化 。 

“RETURN 表达 式 可 以 出 现在 函数 体 中 的 任何 地 方 。 


ORACLE PL/soL INFORWHX 5PL 


局 部 变量 击 咀 varname datatype [r= initvat}: DEFINE varname datatype, 


We | 


IF bootean_expr THEN 1F booslean_expr THEN 




































statements statements 
LELSE [ELSE 
statements] stetements] 





END IF; END IF: 


FOR var IN first..1ast 上 LOOP FOR var IN tfirst TO last’ 
FOR LOE 语句 statements statements 
END LODOP: ERD FOR:; 


RETHRN exprs; RETURN expr， 


DEFINE e elementtype;:- ocal yar 
汇集 x 的 循环 
END FOREACH: 


对 章 / 行 类 型 构造 英 | 9Jacttypetexpr...-】 rowtexpr,...} 
i SELECT expr INTO Yarname SELECT expT INTO varname 
1 4 下 [i 
SELECT TNTO 请 各 FROM ,.. FROM ,.. 


图 4-35 过 程 性 SQL 语 铝 成分，DRACLE PL/SQL 和 INFORMIX. SPL 
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4.5 外 部 阔 数 和 打包 的 用 户 定义 类 型 


在 本 章 中 ， 我 们 已 经 研究 了 允许 我 们 直接 并 相对 容易 地 实现 的 对 象 和 汇集 类 型 。 在 本 节 
中 ,我 们 将 研究 对 象 - 关 系 扩展 ， 即 用 户 定义 类 型 {UDT) 及 其 函数 ， 它 们 的 实现 更 具有 挑战 性 ， 
通常 用 比 执 行 复杂 计算 的 过 程 化 的 SQL 光 有效 的 C 或 Java 人 代码。 但 是 一 旦 实 现 后 ， 新 的 UDT 
像 前 边 讨 论 过 的 一 样 易于 使 用 。 显 然 ， 这 种 情况 为 工具 构造 者 提供 了 写 通 用 的 UDT 并 将 它们 
”的 卖 给 数据 库 商 的 机 会 。 数 据 库 厂 商 已 经 认识 到 这 一 点 的 积极 性 并 为 此 提供 了 便于 安装 的 

UDT “打包 ”机 制 。 这 些 UDT 包 在 INFORMIX 中 被 称 为 DataBlade( 数 据 刀 片 )， 在 DRACLE 中 
称 为 Cartridge、DB2 UDB 则 称 为 Bxtender( 扩 展 器 )。 

例如 ， 文 本 检索 和 包 使 得 书写 涉及 到 在 文档 中 发 现 字 模版 的 应 用 程序 更 加 方便 ， 当 这 样 的 
包 安 装 后 ， 新 UDT 出 现 淮 备 使 用 。 我 们 仍然 将 其 称 为 UDT， 因 为 对 数据 库 厂 商 来 说 它们 是 添 
加 十 去 的 ， 即 便 是 数据 库 商 自 己 销 售 的 包 。 那 些 不 是 作为 数据 库 系 统一 部 分 提供 的 语言 {如 C 
或 Java ) 写 的 函数 被 称 为 外 部 邓 裁 。 

打包 的 UDT 一 般 支 持 “ 多 媒体 ”数据 ， 也 就 是 说 混和 了 非 传 统 数据 类 型 。 涉 及 大 量 数 据 : 
图 像 、 文 本 文档 、 声 音 文 件 、 视 频 等 。 为 了 能 够 处 理 这 些 大 的 数据 对 象 ， 数 据 库 需 要 支持 存 
情 这 些 数据 的 二 进 制 大 对 每 (Binary Large OBiect，BLOB)。BLOB 将 存 后 面 进一步 讨论 。 一 种 
常用 的 实现 技术 是 由 BLOB 和 少量 的 内 部 数据 芙 型 来 构成 一 个 UDT。 例 如 ， 一 个 图 像 可 能 有 
一 个 包含 像素 和 整 型 的 高 度 和 宽度 数据 的 BLOB， 高 度 或 宽度 可 能 是 BLOB 的 一 部 分 或 以 独立 
的 表 值 存在 (依赖 于 数据 库 )。 

为 理解 这 一 主题 ， 我 们 需要 先 介 绍 几 个 在 这 种 包 中 使 用 的 概念 ;: 一 进 制 数据 和 BLOB 、 外 
部 函数 、 封 装 和 特殊 类 型 ， 

i. 二 进 制 数据 和 BLOB 

存储 “自然 数据 ”的 能 力 ， 对 数据 库 而 言 即 长 的 位 种 ， 其 实质 是 为 了 存 米 图 像 、 声 音 
其 他 大 数据 对 象 。ORACLE、INFORMIX 和 DB2 UDB 都 支持 BLOB 。 对 一 个 2MB 的 BLOB ， 
你 可 以 在 INFORMIX 和 ORACLE 中 使 用 BLOB 数 据 类 型 或 在 DB2 UDB 中 使 用 BLOB(2M)。 在 
上 边 的 三 个 产品 中 ，BLOB 可 以 很 据 需要 任意 增长 ， 直 至 所 需 的 资源 耗 尽 。 在 ORACLE 中 
BLOB 的 最 大 长 度 以 字 节 为 单位 为 4GB - 1， 在 INFORMIX 中 可 达 4TB(terabyte)， 在 DB2 UDB 
为 2GB - 1。 

SQL-99 用 命名 扩展 特征 “基本 LOB 数 据 类 型 ”来 描述 二 进 制 字 符 蝇 类 型 BINARY LARGE 
OBJECT 即 BLOB.。 例如 ，BLOB(100}) 提 供 100 字 节 的 存储 空间 ，BLOB(0G) 提供 109 存 情 空 
辣 ( 假 设 数 据 库 支持 这 样 太 的 存储 空间 )。 类 似 地 ，K 和 M 可 以 用 来 表示 千 字 节 和 兆 字 节 。 这 
些 BLOB 可 以 赋予 带 有 十 六 进 制 串 的 字母 值 ， 如 XX'1104ABF'。 根 据 8QL-99 的 另外 一 种 命名 特征 
“扩展 LOB 支 持 "，BLOB 中 的 基部 分 可 以 在 SQL 中 用 二 进 制 串 函数 SUBSTRING 来 访问 ， 且 在 
查询 中 可 纳 用 POSITION 或 LIKE 子 句 来 进行 模式 匹配 。 然 而 ，BLOB 的 完整 的 功能 是 通过 外 部 
定 尽 函数 来 实现 的 。 外 部 函数 可 以 从 文件 中 装载 它们 ， 对 数据 执行 专门 的 计算 ， 并 返回 重要 
结果 给 SQL 调用 者 。 

2, 外 邵 函 数 

外 部 函数 是 用 数据 库 没 有 保存 但 可 以 从 SQL 调用 的 语言 实现 的 国 数 。 在 函数 实现 后 ， 已 编 
译 的 代码 必须 放大 一 个 数据 库 服务 器 可 以 访 疝 的 文件 中 。 然 后 ， 外 部 函数 通过 服务 器 用 Create 
Function 语 句 登 记 。 这 个 语 合 指定 函数 名 、 参 数 、 返 回 值 的 类 型 和 编 幸 代 得 的 个 置 。 需 注意 外 
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部 畏 数 和 已 存储 的 过 程 (代码 存储 在 数据 库 中 ) 都 用 Create Functionm 理 名 注册 ， 但 二 者 的 参数 
不 阿 。 

ORACLE、INFORMIX 和 DB2 UDBHB 都 支持 带 BLOB 、 标 准 数 字 、 字 符 串 或 其 他 类 型 参数 
的 外 部 医 数 。 在 这 三 种 产品 中 ，BLOB 的 部 分 可 以 被 四 部 函数 的 代码 访问 它们 都 使 用 Create 
Function 请 句 来 注册 外 部 函数 ， 尽 管 这 些 产品 在 语法 细节 上 有 些 差 别 。 

Core SQL-99 描 述 了 外 部 隙 数 ( SQL-92 则 没有 )， 并 称 之 为 SQL 调 用 阴 教 ，Full SQL-99 还 
描述 了 外 部 方法 ， 即 附属 于 用 户 定义 类 型 的 外 部 函数 。 这 些 也 都 用 Create Function 语 句 注 册 。 

3. 封装 

封装 用 二 使 程序 不 能 通过 除 与 对 每 关联 的 上 方法 和 用 户 定 义 函 数 以 外 的 其 他 途径 来 访问 对 
象 中 的 数据 的 情形 。 封 装 的 一 个 例 于 如 INFORMIX 的 不 透明 类 型 。 将 封装 作为 面向 对 象 概念 
的 讨论 参见 4.2.3 节 。 

4. 特殊 类 型 

可 以 从 任 一 其 他 内 部 或 非 内 部 的 类 型 使 用 特殊 类 型 (distinet type} 的 方式 复制 现 有 类 型 为 新 
和 甘 型 。 特 诛 类 型 一 旦 被 定义 ， 就 会 锌 当 作 单独 的 类 型 处 理 ， 这 样 ， 如 果 类 型 吕 是 基于 类 型 IT 的 
特殊 类 型 ， 不 经 过 类 型 转换 (一 种 显示 改变 类 型 的 方法 ) 就 不 能 比较 这 两 种 类 型 的 对 象 。 特 殊 类 
型 的 思想 是 提供 类 型 检查 来 捕获 诸如 将 价格 与 百分数 或 将 美元 价格 与 日 元 价格 比较 的 错误 。 

5.BLOB 对 和合 

一 般 地 ， 如 果 一 个 数据 库 支 持 BLOB 和 传递 BLOB 及 其 他 多数 有 用 类 型 的 外 部 函数 ， 则 该 
数据 库 也 支持 函数 可 访问 的 UDT， 即 封装 的 对 象 。 要 支持 在 播 人 和 更 新 中 使 用 BLOB 对 象 的 
更 新 销 数 在 很 多 情形 下 是 很 困难 的 。 现 在 考虑 往 例 4.4.20 和 例 4.4.4 的 inc_age () 酒 数 中 我 们 
是 如 何必 须 复 制 一 个 局 部 变量 返回 给 调用 者 的 情形 。 -一般 地 , 我 们 不 可 能 复制 一 个 局 部 BLOB ， 
内 为 它 可 能 超过 内 存 容量 。 这 样 ， 除 非 数 据 库 厂商 确保 -- 直 直接 引用 返回 的 BLOB 的 方法 ( 像 
DB2 UDB DB 一 样 )， 然 而 ， 返 回 一 个 BLOB 值 可 能 是 椒 可 能 的 。 如 果 数 据 库 厂商 不 提供 这 种 
能 力 ， 则 你 需要 用 C 详 句 (或 其 他 过 程 性 语言 ) 写 一 个 能 够 知道 哪些 表 的 娜 些 列 需要 转载 或 更 
新 的 专门 的 BLOB 装 载 娠 或 于 新 器 。 在 很 多 情况 下 ， 这 应 该 不 是 严重 的 问题 . 

对 BLOB 对 和 象 应 用 ， 考 虑 我 们 在 4.4 节 中 使 用 的 和 祭 形 的 例子 。 我 们 可 以 使 用 4 个 整数 以 16 字 
节 长 的 BLOB 来 存 储 定义 短 形 的 两 个 点 的 坐标 。 我 们 可 以 写 一 个 外 部 函数 area 1) 来 接受 一 个 
BLOB ， 获 得 在 它 之 外 的 4 个 数字 来 计算 面积 ,用 C 或 Java 实 现 。 类 似 地 ， 我 们 可 以 实现 
insiqef) 国 数 。 然 后 ， 在 SQL 中 ， 我 们 可 以 建立 一 个 带 有 BLOB 列 的 表 ， 并 按照 4.4.2 节 中 
我 们 处理 用 户 定 广 函数 的 方式 来 使 用 这 些 玉 数 。 我 们 可 以 需要 放 专 门 的 程序 将 矩形 装 人 
BLOB 列 中 。 

尽管 我 们 可 能 想 命 名 这 种 rectangle_t 类 型 ， 在 一 些 产 品 中 ， 我们 可 能 会 使 用 BLOB 作 
保留 类 型 名 。 如 果 数 据 库 支持 特殊 类 型 ， 这 种 能 力 可 以 使 我 们 将 BLOB 类 型 重 命 名 为 
rectrangle t+ 类型。 但 是 ， 即 使 没有 特殊 的 类 型 名 ，BLOB 及 其 函数 也 具有 对 锭 类 型 的 重要 
特点 ， 我 们 可 以 将 以 这 种 方式 实现 的 对 象 称 为 BLOB 对 条。 

当然 ， 为 了 更 实现 ， 我 们 应 该 考 虚 比 保存 在 BLOQB 的 矩形 更 复杂 的 人 情形。 实际 上 ， 我 们 应 
该 在 需要 用 到 BLOB 的 强大 能 力 的 时 候 使 用 它 。 注 意 ， 尽 管 在 SQL 中 BLOH 的 设置 各 种 产品 间 
非常 类 似 ， 由 C 实 现代 码 使 用 的 BLOB 程 序 接口 会 有 相当 多 的 变化 。 

尽管 通常 对 BLOB 的 讨论 很 有 用 ， 查 我 们 需要 注意 伴随 在 其 中 的 许多 的 特定 产品 的 细节 ， 
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同时 一 些 BLOB 对 象 的 竞争 者 也 值得 注意 。 让 我 们 来 看 一 下 这 三 种 不 同 的 产品 。 

6. 打包 的 UDT 和 其 他 封装 的 UDT 

INFORMIX 最 早 支 持 UDT， 有 最 儿 的 UDT 包 。UDT 包 被 称 为 DataBlade ( 数据 刀片 )， 可 
以 被 DBA 安 装 以 支持 特定 数据 类 型 的 访问 ， 如 地 理 数 据 和 图 像 。 数 据 库 程 序 员 可 以 用 数据 库 
建 模 类 型 写 他 们 上 自己 的 DataBlade。 这些 类 型 通常 是 基于 内 部 BLOB 类 型 的 。 有 专门 的 
DataBiade 管 理 器 来 处 理 DataBilade 的 函数 和 类 型 登记 ， 

第 称 为 不 下 明 类 型 的 单个 UDT 更 为 简单 而 易于 实现 并 且 对 数据 库 程 序 员 完 全 文档 化 。 不 
和 明 类 型 是 基于 lvarchar 的 属性 类 型 。 它 们 必须 小 得 足以 装 人 程序 内 存 ， 于 是 它们 通常 被 限制 
在 1GB 以 内 。 不 透明 类 型 由 Create Opaque Type 语 名 定 义 并 完全 封装 。 它 们 可 以 包 会 艇 入 式 
BLOB 引 用 《 称 为 locator )， 由 不 透明 类 型 的 汕 数 管理 。 不 透明 类 型 的 输入 函数 可 以 被 SQL 
Insert 说 人 句 使 用 ， 匡 数 可 以 用 于 比较 ，、 批 量 装载 及 其 他 数据 库 操 作 。 

不 透明 类 型 的 师 数 必须 用 C 语 言 书写 ， 因 此 它 是 外 部 医 数 。 每 个 函数 由 数据 库 使 用 Create 
Function 语 句 按 图 4-33 给 出 的 语法 注册 ， 对 外 部 销 数 的 情形 ，Create Function 语 可 的 SPL 曙 数 
体 ( 图 4-33 中 的 statements 行 ) 部 分 被 一 个 指定 复杂 代码 文件 的 EXTERNAL NAME 子 句 和 指定 为 
C 语 言 的 LANGUAGE C 子 钉 普 换 ， 

DRACLE 中 与 JINFORMIX 的 DataBlade 对 应 的 打包 UDT 为 “Cartridge"、 例 如 ，Virage 公 司 
提供 可 以 同时 用 作 INFORMIX DataBlade 和 ORACLE Cartridge 的 图 像 检 索 软 件 。 数 据 库 程序 
员 可 以 写 PL/SLQ 或 用 C 写 访问 BLOB 的 外 部 函数 来 设立 一 个 BLOB 对象 。 在 PL/S8QL 或 C 中 ， 
BLOB 可 以 通过 字 串 西数 或 其 他 只 读 示 数 访问 《只 读 维 持 我 们 从 SQL 调用 它 的 能 力 )。 任 一 国 
数 类 型 用 Create Function 语 人 句 在 数据 库 中 登记 ， 像 4.4.2 节 介绍 的 成 员 函 数 一 样 。 对 外 部 痛 数 的 
情况 ，PL/SQL 函数 体 (AS 或 1S 后 的 部 分 ) 被 一 个 描述 编译 后 代码 的 位 置 EXTERNAL 
LIBRARY 或 各 种 可 选 的 语 铝 替换。 尽管 BLOB 可 以 传递 给 外 部 函数 ， 但 对 象 和 汇集 却 不 能 。 
这 一 点 并 不 是 严重 的 问题 ， 央 为 我 们 可 以 有 带 BLOB 属 性 的 对 象 ， 你 可 以 把 BLOB 加 上 上 任何 其 
他 所 需 的 属性 作为 参数 传递 给 外 部 函数 。 为 此 ， 你 将 需要 写 一 个 专用 的 BLOB 上 载 程 序 ， 

从 版 本 5.2 开 始 ，DB2 UDB 具 有 像 ORACLE 的 对 人 象 和 INFORMIX 的 行 类 型 那样 的 结构 化 的 
用 户 定义 类 型 。 像 INFORMIX 一 样 ， 这 些 类 型 可 能 被 安排 在 继承 层次 ， 并 且 像 ORACLE 一 样 ， 
它们 可 由 REF 指 问 。 然 而 ，UDT 并 没有 被 完全 集成 到 数据 库 的 类 型 系统 中 。 例 如 ， 不 能 有 
UDT 类 型 列 ， 尽 管 一 个 列 中 可 能 包 合 指向 UDT 的 REF。DB2 UDB 在 很 早 人 以 前 就 有 具有 外 部 耳 数 
利 实现 BLOQB 对 象 的 BLOB 能 力 。 使 用 DB2 UDB 的 特殊 类 型 能 力 ， 每 个 对 象 可 有 一 个 用 户 指定 
的 和 名字。 这 些 UDT 的 包 称 为 Extender， 操 纵 UDT 的 外 部 疯 数 可 用 C 或 Java ( 或 C++ 及 其 他 语言 ) 

DB2 UDB 支 持 用 户 定义 隔 数 ， 即 允许 从 用 户 晴 数 以 表 的 形式 一 个 接 一 个 地 返回 行 给 系 
统 的 编程 接口 。 这 样 ， 使 用 用 户 定义 的 表 苯 数 可 以 使 任意 一 种 表格 式 的 数据 看 起 来 像 一 个 表 
一 样 ， 这 是 -- 种 方便 的 扩展 数据 库 的 方式 。 另 外 ， 在 撰写 本 文 时 ，DB2 UDB 还 不 支持 汇集 
类 型 。 

7. 小 结 

显然 ， 前 面 任 一 种 数据 库 都 支持 多 媒体 数据 。 图 4-36 给 出 了 这 些 数据 库 逐 个 特征 的 比较 。 
每 个 数据 库 都 有 各 自 的 书写 访问 ( 只 读 ) 数据 的 外 部 了 男 数 的 方式 ， 这 些 外 部 图 数 都 可 以 由 SQL 
调用 。 我们 可 以 购买 INFORMIX 的 DataBlade、ORACLE 的 Cartridge 、DB2 UDB 的 Extender 中 
的 某 一 种 产品 ， 使 用 这 些 产 品 提供 的 UBT 和 了 晴 数 来 访问 数据 。 这 些 也 的 数 自 正在 增长 ， 你 可 
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以 访问 数据 岸 三 商 的 Web 端 点 了 解 当 前 的 产 岛 状 涡 。 这 三 种 产品 的 URL 地 址 分 别 为 ， 


WWW.Oracle.com, www,informix.com 和 www.ibm.comdb? . 
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推荐 读物 
Stonbraker 和 Hellerstein 的 《Readines? (推荐 读物 [9 给 出 了 太 量 关于 代替 关系 系统 的 数据 
模型 和 原型 系统 的 基础 性 的 文章 。 关 于 面向 对 和 象 和 对 每 ~ 关系 的 更 完整 的 论文 集 可 以 在 Zdonik 
和 Maier 的 [10] 中 找到 。 推 荐 读物 [1] 集 中 介绍 了 一 个 特定 的 面向 对 象 数 据 库 (OODBMS， 即 0),)， 
在 其 第 1! 章 中 包括 了 “面向 对 象 数据 库 系 统 宣言 ”。 其 他 读物 则 是 关于 其 有 对 象 -关系 能 为 的 特 
定 的 产品 DB2 UDB (12] 和 [3] )，INFORMIX { [4] 和 [5] ) 和 ORACLE [6]、f71 和 [8] ) 的 。 
[1]] Francois Bancilhon, Claude Delobel, and Paris Eanellakis, cditors. Building an Opbject- 
Oriented Database System, The Story of O,,. San Mateo, CA':Morgan Kaufmann, 1992. 
[2] Don Chamberlin, A complete Cuide to DB2 Universal Database. San Francisco: Morgan 
Kaufmann, 1998. 
[3] D2 Universal Database SOL Reference Manuail. Version ©. IBM, 1999. Availlable at 
htitp:i/vw ww.ibm.conm/db2. 
[4] INFORMIX Guide to SQL Syntax, Version 9.2. Menlo Park, CA: lnformix Press, 1999. 
{Includes SPL syntax). 
[SS] INFORMIX Guide to SOL: Tutorial. Version 9.2 Menlo Park, CA: Informix Press, 1999, 
[6] ORACLES PL/SOL User'’s Guide and Reference. Redwood City, CA: 
Oracle,http:Awww-oracle.cormn， 
[7?] ORACLES Server Application Developer’s Guide.Redwood City, CA: 


Oracle.http://www.oracle.com. 
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[8] ORACLES Server SOQL Languasge Reference Manual. Volume 1 and 2. 
http:i// www.oracle.com. 

[9] Michael Stonbraker and TJoseph M.Hellerstein, editors. Readings in Dtabase Systenms, 
3rd ed. SanFrancisco: Morgan Kaufmann, 1998, 

[10] Stanjey B. Zdonik and David Maier, editors. Readings in Opject-Oriented Database 
Systenis. San Mateo, CA: Morgan Kaufmann, 1998. 


习题 


于 面 的 部 分 习题 的 解 管 在 本 书 最 后 的 “习题 解答 ”中 给 出 ， 这 些 有 答案 的 习题 用 * 导 标注 。 
除非 特别 声明 ， 否 则 习题 可 以 用 ORACLE 或 INFORMIX 来 完成 。 
4.1 下 面 是 一 些 对 People 表 的 查询 。 
{aj* 查找 教 名 ( 中间 名 ) 为 空 的 人 的 ssno。 
(b) 查找 名 字 为 空 的 人 的 s sno。 
(ch 使 用 对 象 等 价 检测 人 名 的 方式 查找 名 字 相 同 的 人 的 ssno 对 。 
(d) 查找 关于 年 龄 最 大 的 人 的 一 切 信 息 ， 并 以 person 对 象 的 形式 显示 。 
4.2 假定 student tt 娄 型 中 有 一 个 persgon 上 型 其 吕 一 个 整 型 的 学 号 ID ， 一 个 电子 邮 
件 名 字 和 预期 的 毕业 年 份 ( 整 数 ) 其 中 person_t 不 能 为 空 。 
(ahs 定义 student_t 类 型 和 一 个 student 表 (ORACLE 中 的 对 象 表 或 INFORMIX 中 
的 类 型 表 )， 以 学 生 ID 作 为 主键 。 
(b) 给 出 插 人 一 个 学 生 的 语句 ， 该 学 生 和 名 为 Susan A 太 ,， Morris， 年 龄 为 25 岁 ， 社 会 保 
| 障 号 和 学 号 都 为 231458888， 岂 子 邮 件 名 为 “samorris” ， 巴 计 于 2001 年 毕业 。 
4.3 【 仅 用 DRACLE ) 考 虚 习题 2.5 的 查询 。 确 定 哪 一 个 可 以 用 REF 完 成 ， 并 将 其 写 出 。 
可 以 使 用 3.6 节 描述 的 ORACLE 支持 的 SQL-92 的 扩展 。 注 意 带 点 号 的 问题 本 章 和 第 2 
章 一 样 都 有 答案 。 
4.4 汇集 上 的 查询 : 
{a)* 查找 仅 为 雇员 的 家 属 的 家 属 。 
tb) 检查 emp1oyees 中 的 任 一 麻 员 是 否 被 列 为 他 7 她 自己 的 家 属 ， 如 果 是 ， 则 显示 
出 该 雇员 的 eida。 并 使 用 对 象 则 的 比较 。 
(cj* 计算 phonebock 中 的 电话 扩展 号 为 100 的 人 煞 。 
4.5 对 汇集 的 高 级 查 何 : 
(ajs 查找 和 一 个 或 多 个 家 属 问 名 的 雇员 的 eid。 
(b) 查找 家 属 年 龄 比 他 /她 目 己 大 的 雇员 。 
(c)* 查找 并 显示 100 雇 员 的 最 老 的 家 属 。 
(d) 显示 phonebook 中 的 扩展 号 大 于 1000 的 人 的 ssnoc 
(e)* 显示 phonebook 中 的 扩展 号 在 800 到 900 之 则 的 人 的 ssno。 
4.6 用 户 定义 函数 和 方法 ; 
(ay* 查找 在 三 个 以 上 的 矩形 中 出 现 的 点 ， 显 示 这 样 的 点 和 覆盖 这 些 点 的 定形 数 ， 并 
按 数 量 从 高 到 低 排 友 。 
(b) 查找 覆盖 的 点 最 多 的 矩形 。 
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(c)* 查找 被 面积 最 大 的 年 形 所 覆 半 的 点 。 
(d) 按 面 积 由 大 到 小 显示 答 形 。 
4.7。 【( 仅 用 ORACLE ) 尽管 我 们 希望 例 4.4.9 的 查询 能 显示 一 些 对 象 方法 的 思想 和 功能 ， 
民 是, 方法 对 查 何 来 说 并 不 是 必须 的 。 用 交互 式 SQL 与 出 完成 同样 功能 的 查 交 。 
4.8 《和 仅 用 ORACLE ) 考虑 在 点 和 和 矩 形 间 的 一 个 “above” 操 作 : 车 一 个 点 的 y 值 大 于 
(>=) 和 矩形 点 的 ?> 值 且 在 和 抱 形 的 * 值 之 间 ， 则 这 个 点 在 矩形 上 。 将 这 个 操作 转换 为 方法 。 
4.9 建立 一 个 requests 表 ，requests 表 的 每 一 行 有 一 个 名 为 wds 的 以 varchar(30) 定 义 
的 包含 匹配 的 词 集合 的 SET 类 型 列 ， 和 一 个 整数 请 求 的 ID reaiga。 
(a) 构造 并 检 证 一 个 匹配 请 求 文档 的 Select 查 询 ， 即 查找 包含 请 求 中 所 有 关键 词 
的 文档 。 
(b》 实现 相交 记 数 函数 或 成 员 ， 并 构造 一 个 匹配 部 分 关键 词 的 查询 ,特别 地 ， 再 构 
造 一 个 至 少 匹 配 一 半 的 请 求 关键 词 的 查询 。 
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对 SQL 语 言 的 改进 日 的 之 一 是 为 了 使 最 终 用 户 能 够 使 用 SQL 对 数据 库 进行 特定 的 查询 。 
以 前 的 查询 功能 依赖 于 应 用 程序 ， 并 且 大 多 数 数据 处 理 中 心 存在 积压 工作 ， 以 至 于 新 的 应 用 
程序 要 等 上 数 月 的 时 间 。 回 忆 一 下 ， 在 第 1 章 中 ， 我 们 曾 把 一 个 通过 交互 式 SQL 访 问 数 据 库 的 
最 终 用 户 称 为 临时 用 户 。 由 于 一 些 原 因 ， 事 实证 明 直 接 通 过 SQL 访问 数据 的 最 终 用 户 数量 并 
不 姑 预 想 中 那么 和 多， 相反 ， 天 多 数 用 户 仍 然 通 过 应 用 程序 接口 访问 数据 。 通 常 把 通过 一 个 药 
单 应 用 程序 访问 数据 库 的 用 户 称 之 为 初级 用 户 ， 这 一 菜单 应 用 程序 在 显示 器 上 提供 了 各 种 表 
格 选择 ， 从 而 避免 了 使 用 SQL 中 Selecet 语 句 的 语法 。 应 用 程序 员 正 是 出 于 这 一 月 的 而 书写 的 
程序 称 为 菜单 应 用 程序 ， 或 表单 应 用 程序 。 从 程序 员 的 观点 来 看 ， 应 用 程序 逻辑 通过 一 个 衣 
格 界 面 与 最 终 用 户 进行 交 瑟 ， 确 定 用 户 的 要 求 ， 然 后 通过 执行 SQL 语句 完成 这 些 要 求 。 大 过 
数 与 数据 打交道 的 人 ， 诸 如 银行 职员 、 机 票 预定 代理 人 人， 都 是 使 用 表单 应 用 程序 来 完成 他 们 
的 工作 的 。 

册 入 式 SQL 是 指 在 程序 内 执行 的 SQL 语句 ， 它 强调 这 些 SQL 语 铝 是 “ 艇 人 ”在 编程 语 吾 
(或 宿主 语言 例如 C，Java，COBOL ，Fertran) 的 常规 语句 中 的 。 由 于 应 用 程序 员 发 现 能 人 式 
SQL 提供 了 一 个 比 在 关系 模型 存在 之 前 访问 数据 更 加 容易 的 平台 ， 使 用 这 种 形式 可 以 实现 许 
多 SQL 语句 早期 的 功能 。Java 中 标准 的 虞 入 式 SQL 称 为 SQLJ， 可 以 在 ORACLE、INFORMIX.、 
DB2 UDB 中 使 用 ， 也 可 以 通过 JDBC 在 Jaya 中 使 用 SQL，JDBC 是 标 淮 Java 的 一 部 分 ， 用 来 连 
接 到 任何 数据 库 或 数据 库 的 一 部 分 . 在 本 章 中 , 我 们 将 重点 放 在 C 知 言 编 握 的 肯 人 式 SQL 程 序 . 
如 果 你 不 是 完全 熟悉 C 语 言 ， 只 要 你 有 其 他 语言 的 编程 人 经验， 这 应 该 是 一 个 不 难 克 服 的 障碍 ， 
外 为 我 们 考 弄 的 程序 是 相当 简单 的 。 由 寺 只 有 个 踢 的 格式 上 的 不 同 ， 如 和 町 人 名 字 或 输出 格式 ， 
因此 只 要 从 本 书 中 (或 从 在 线 的 重子 中 ) 拷贝 程序 格式 ， 就 是 够 你 完成 大 部 分 的 任务 了 。 同 
时 ， 你 应当 注意 本 章 中 提 到 的 新 的 概念 ， 特 别 是 如 果 你 缺少 C 语 言 背 景 知 识 的 话 ， 你 可 能 需要 
特别 努力 地 掌握 细节 。 有 一 些 很 好 的 CC 诺言 书 可 殿 人 参考 ， 特 别 推 荐 一 本 导论 性 的 书 《 The C 
Programming Language》， 由 Kerighan 各 Ritchie 著 。 

现在 让 我 们 来 看 一 下 大 多 数 一 般 的 数据 库 任 务 静 选择 表单 应 用 程序 而 不 是 交互 式 SQL 的 
原因 。 首先 使 用 交互 式 SQL， 必 须要 清楚 地 知道 所 有 表 、 列 名 并 且 能 够 写 出 符合 语法 的 
SQL 语 句 ， 这 一 点 分 散 了 专家 在 实际 工作 虐 的 注意 力 , 设想 一 个 机 票 防 订 代 理 大 想 权 写 即 席 
的 SQL 语 句 来 预订 班机 、 安 排 座 位 、 安 置 顾客 进 天 等 待 队 列 、 处 理 不 同 的 付款 方式 ; 等 等 。 
即使 是 最 有 经 验 的 数据 库 系 统 程序 员 通 常 也 利用 表单 应 用 程序 执行 一 些 支 持 工 作 ， 诸 如 追踪 
出 错 报告 ;与 写 即 席 的 SQL 语句 相 比 ， 这 是 对 技能 要 求 较 低 的 一 个 接口 。 

倾向 于 应 用 程序 而 不 用 即席 SQL 的 第 二 个 原因 ， 在 于 许多 我 们 认为 简单 的 任务 并 不 能 仅 
仅 通 过 非 过 程 的 SQL 语句 来 完成 ， 而 是 经 常 要 使 用 -- 些 程序 循环 ， 例 如， 假设 你 需要 得 到 某 
一 列 值 的 中 值 。 所 谓 一 组 值 的 中 值 是 指 这 样 的 值 ， 这 组 值 中 至 少 有 一 半 的 值 小 于 等 于 它 ， 至 
少 有 一 - 半 的 从 大 于 等 于 它 。 因 为 不 存在 内 部 函数 MEDIAN， 所 以 通过 一 条 Select 语 名 是 不 能 得 
到 这 一 中 值 的 。 在 本 章 中 ， 我 们 将 看 到 怎样 通过 使 用 谋 人 式 SQL 的 简单 程序 来 完成 这 样 的 任 


rr 
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和 劳 。 另 外 .一 些 任 务 需要 写 一 组 SQL 语句 来 读 取 不 后 的 行 ， 然 后 根据 所 读 到 的 内 容 来 更 新 其 
中 的 某 些 行 ， 这 时 必须 保证 其 他 用 户 所 做 的 修改 不 会 破坏 结果 。 我 们 需要 将 这 -- 给 SQL 语 条 
捆 部 和 在 特定 的 不 可 分 割 的 称 之 为 事务 的 包 内 。 在 这 一 方面 ， 时 人 式 SQL 的 过 程 人 性 功能 显得 万 

第 三 点 、 倾 向 于 使 用 表单 应 用 程序 还 因为 它 使 我 们 摆脱 了 书写 SQL 语 名 时 中 到 的 :一 些 复 
杂 的 语法 ( 例如, 用 于 实现 FOR ALL 条 忻 的 形式 }, 以 及 在 书写 过 程 中 时 常会 出 现 错误 的 情况 。 
在 许多 商业 领域 ， 不 正确 的 查询 ( 更 精 的 是 ， 不 正确 的 更 新 语句 ) 会 导致 可 怕 的 结果 显然， 
我 们 希望 让 专业 程序 员 来 处 理 这 些 语 法 问题 ， 他 们 既 有 时 间 也 有 能 力 写 出 正确 的 SQL 语 句 。 
同时 既然 这 些 语句 在 同 - .领域 被 反复 使 用 ， 我 们 可 以 获得 革 种 一 致 性 ， 这 种 一 致 性 在 多 数 商 
业 领 域 极为 重要 . 

而 另 一 方面 ， 在 有 些 特殊 情况 下 ， 却 倾向 于 使 用 交互 式 SQL。 某 些 特 别 的 用 户 需 要 使 用 
不 寻常 的 、 复 条 的 得 训 ， 而 一 般 的 编程 接口 不 能 提供 这 些 查 询 。 人 同 邵 ， 图 书 管理 员 需 要 为 展 
疝 者 查找 他 们 所 需要 的 书 ， 显 然 手工 查找 已 被 证 明 效 率 极 低 而 不 再 被 合用。 另外 由 于 上 文 提 
到 的 应 用 程序 的 积压 ， 在 表单 二 用 程序 尚未 书写 完成 的 特殊 情况 下 ， 交 互 式 SQEL 将 为 用 户 提 
供 工 具 。 然 而 ， 在 这 种 情况 下 ， 主 凤 考 虑 可 能 产生 错误 结果 的 风险 ， 因 而 实现 能 够 仆 理 这 些 
特殊 情况 的 应 用 程序 应 该 一 站 是 我 们 的 -个 目标 。 

在 介绍 让 人 式 SQL 的 具体 功能 之 前 ， 先 让 我 们 来 看 一 下 想 要 得 到 的 是 什么 。 本 章 的 日 标 
是 提供 给 你 在 脱 入 式 SQL 程 序 中 实现 任何 算法 所 需 的 技术 ,在 我 们 向 这 一 日 标 近 进 的 过 程 中 ， 
需要 不 断 邮 状 则 一 些 复杂 的 技术 。 为 了 避免 在 这 些 具体 细 世 中 迷 笑 方 回 ， 你 必须 记 住 这 些 技 
术 本 身 并 不 是 我 们 的 日 标 ， 能 够 知道 拔 信 式 $SQL 语 句 中 每 一 个 新 功能 在 实现 访问 数据 库 的 应 
用 程序 中 所 起 的 作用 ， 这 才 是 重要 的 ,在 5.1 凶 中 我 们 介绍 了 在 程序 中 使 用 Select 语 名 访问 数 
据 的 基本 语法 ; 为 在 一 个 循环 中 访问 密 条 记录 而 对 Select 所 作 的 微小 改动 (通过 声明 一 个 游标 
抽取 多 条 记录 )。 在 5.2 节 中 我 们 将 学 当 如 何 姓 理 各 种 不 同 的 出 错 返 同 ， 同 时 学 习 如 何 识 别 其 
他 条 件 类 型 ， 例 如 通过 游标 检索 多 条 记录 时 的 循环 结 桌 条 件 ， 或 者 是 当 读 电 的 记录 中 某 列 市 
现 空 值 时 的 和 条件， 在 5.3 节 中 ， 我 们 详细 地 给 出 了 一 些 圣 人 式 SQEL 语 铝 的- 般 格式 ， 也 括 新 的 
Update 语 名 的 悄 式 . 

在 5.4 节 ， 我 们 考虑 了 前 面 提 到 的 有 关 事 务 的 一 些 细节 。5.5 记 给 出 了 用 程序 实现 的 在 非 过 
程式 SQL 中 不 能 完成 的 一 些 任务 的 例子 。 

5.6 节 提 到 了 动态 SOL。 在 前 面 有 关 静 态 SQL 的 章节 中 ， 所 有 的 嵌入 式 SQL 语 名 必须 在 编 
泽 之 前 就 在 程序 源 文 御 中 以 文字 语句 的 形式 存在 。 而 动态 SQL 提供 了 更 大 的 灵活 性 ， 爷 许 髓 
人 式 SQL 语 句 牛 有 字符 串 变 量 ， 以 便 在 程序 编译 时 具体 内 容 是 不 能 预知 的 SQL 语句 能 侣 根据 
用 户 需求 的 改变 而 动态 地 建立 并 执行 。 动 态 SQL 的 确 比 较 复 杂 ， 这 正 是 我 们 将 它 放 到 后 和 面 童 
入 的 原因 。 

本 章 中 ， 你 将 会 症 学 习 这 程 中 磁 到 两 种 数据 库 系统 闻 的 某 些 区 别 ， 这 两 种 数据 库 系 统 分 
别 是 ORACLE 和 DB2 UDB。 所 右 其 他 主要 的 DBMS 产 品 也 支持 帕 入 式 SQL.。 如果 我 们 的 描述 
应 用 于 某 -特定 的 系统 时 ， 我 们 将 会 指出 ; 如 果 对 一 -个 举人 入 式 SQL 功 能 描述 时 没有 这 样 的 说 
明 ， 就 意味 着 这 - -功能 是 基本 SQL 的 一 部 分 (可 参见 第 3 章 第 一 段 )}、 本 总 中 所 涉及 到 的 基本 
相信 式 SQL 语 名 与 X/Open 、SQL-92 和 SQL-99 中 的 很 接近 ， 肉 -- 的 区 唱 在 于 使 用 游标 时 出 现 
的 WITH HOLD 于 句 ， 这 存 5.4 节 的 最 后 讨论 .， 在 附录 C 中 按 字 母 版 序 给 出 了 不 同 的 SQL 语 侣 
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格式 ， 可 和 作 参 考 ， 而 不 必 依 赖 于 以 后 章节 中 的 分 述 顺 序 。 在 不 断 学 习 黎 人 式 SQL 的 过 程 中 ， 
应 该 不 时 地 参考 附 永 C。 附 录 B 中 涉及 的 在 ORACLE 和 DB2 UDB 中 编写 能 和 人 式 程序 时 与 产品 
有 关 的 问题 。 


5.1 C 语 言 中 其 入 式 SQL 的 介绍 


当 程 序 员 在 宿主 语言 源 文 件 中 写 人 媒人 式 SQL 语 名 时 ， 在 SQL 语句 之 前 必须 有 exeec 
sq1 短 增 ; EXEC SQL 语 句 可 以 扩展 到 该 文件 的 多 行 。 侧 如 ， 以 下 是 C 语 言 中 嵌入 式 SQL 语 句 
的 一 个 例子 : 


上 -1 exec sql select countt*)y into :host var 


from customers; 

广 意 到 C 语 言 的 源 文件 通常 是 小 写 的 ， 所 以 尽管 在 许多 文本 中 使 用 大 写 的 SQL 语句 ， 我 们 
仍然 遵循 C 堵 言 的 这 一 习惯 ， 使 用 小 写 。 请 句 格式 自由 、 可 以 跨越 多 行 、 以 分 号 作为 结束 ， 这 
是 C 语 言语 句 的 标准 。 而 在 COBOL 中 ， 语 旬 通 常 并 不 像 C 语 言 中 那样 跨越 多 行 、 格 式 自由 ， 
并 且 它 的 能 人 式 SQL 语 句 是 以 ena-exece 和 作为 结束 的 。 

接 下 来 ， 我 们 将 描述 一 些 实 现 一 个 非常 简单 的 嵌入 式 SQL 程序 、 执 行 一 条 Select 语 句 然后 
打印 出 结果 所 需要 的 特征 。 

1. 使 用 诅 入 式 SQL 的 简单 程序 

首先 我 们 介绍 一 些 基 本 的 语言 特征 ， 为 讲述 例 5.1.1 中 的 程序 作 准 备 。 必 须 注 意 到 C 语 言 
坪 程 序 通常 是 不 能 识别 敌人 式 SQL 中 的 EXEC SQL 语句 的 ， 因 而 通 常 源 文 件 需要 首先 通过 预 纺 
笑 程 序 ， 将 这 些 艇 人 式 语 名 转换 为 对 数据 库 引 警 的 C 语 言 函 数 调用 。 

(1) 声明 部 分 

在 仙 入 式 SQL 程 序 中 ， 程 序 逻 辑 可 以 使 用 普通 的 程序 变量 ， 即 宿主 变量 ,来 表示 SQL 语 
名 中 的 一 些 语法 元 素 。 例 如 ， 我 们 可 能 需要 声明 一 些 程序 变量 来 存放 查询 得 到 的 值 ， 比 如 说 
cname (使 用 变量 cust_name,， 具体 结构 将 在 后 面 解释 }、discntt 使 用 变量 
cust_discnt )， 以 及 用 户 在 WHERE 子 铅 中 提供 的 值 cia( 使 用 变 基 cust_id)。 这 样 我 们 就 
可 以 通过 柑 人 入 式 SQL 语 句 来 完成 检索 。 


[5,1.23 exec Sql] select cname, discnt into :cust_ name, :cust discent 


from customers where cid = :cust id: 


注意 到 这 一 Seleet 语 句 中 新 的 INTO 子 句 ， 以 及 在 艇 人 式 SQL 语 句 中 使 用 宿主 变量 时 必须 
在 它们 之 前 加 冒号 (:)。 执 行 这 一 语句 ， 如 果 字 符 串 变 量 cust_id 已 在 这 一 C 程 序 之 前 被 设置 
为 c001， 从 图 2-2 中 的 customers 表 可 以 看 到 变量 cust_name 和 cust_discnt 分 别 被 赋予 
了 值 “TipTop” 和 10.000。 

要 在 明 和 人 式 SQL 语句 中 使 用 这 些 宿 主 变量 ， 必 须 先 声明 它们 ， 包 括 对 预 编 译 程序 的 一 个 
声明 《需要 特殊 的 对 符 )。 我 们 在 C 语 言 程序 中 一 个 特殊 的 嵌入 式 SQL 声 明 部 分 声明 这 些 恋 
量 ， 所 有 这 样 的 声明 都 在 那里 完成 。 下 面 给 出 了 声明 在 [5.1.2] 的 Select 庄 句 中 所 需要 的 变量 
的 例子 。 


[S.1.3] exec 5S91 begin declare section: 
char cust id[$] = "coO0l™;: fA#* declare and jnitialize cust id 本 


Char Dust_name[14]: 


mi Lb 
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fioat cust _discnt; 
exec S91 end teciare section;: 
这 三 个 变量 的 声明 是 标准 的 C 语 言 的 声明 ， 出 现在 Begin Declare 语 句 和 End Declare 语 句 之 
闻 ， 这 是 预 编译 程序 和 C 语 训 编 译 穆 序 都 能 够 理解 的 相同 格式 。 艇 人 式 SQL 语句 中 使 用 的 宿主 
变量 的 数据 类 型 必须 能 被 数据 库 系 统 识 别 ， 这 一 点 很 重要 。 有 些 情况 下 可 能 短 要 对 得 到 的 数 
据 库 值 进行 类 型 转换 ， 转 换 为 宿主 变量 的 数据 类 型 。 例 如 ， 如 果 我 们 改变 [5.1.3] 中 对 
cust_discnt 的 声明 ， 使 它 只 能 接受 整 型 数据 。 


int custk_ discent: 


然后 执行 [5.1,2] 中 的 Select 语 句 ， 这 时 变量 cust_discnt 的 值 将 是 10, 而 不 是 10.00。 然 而 ， 
这 会 丧失 一 些 精确 性 ， 比 如 ， 如 果 容 户 c009 的 9iscnt 值 为 11.3， 而 通过 [5.1.2] 中 的 Select 语 句 
得 到 的 cust_discnt 结 果 为 11。 这 些 我 们 都 已 相当 熟悉 了 ， 但 是 对 于 在 炭 入 式 SQL 语 何 中 接 
县 字 符 串 的 C 变 量 格式 还 需要 许多 说 明 ， 我 们 在 看 过 第 …- 个 程序 的 例子 之 后 才 提 到 这 些 说 明 。 

(2) 在 SQL 中 建立 连接 和 释放 连接 

在 一 个 能 人 式 SQL 程 序 的 开始 ， 穆 序 逻 辑 面临 着 和 交互 式 用 户 同样 的 问题 : 怎样 与 SQL 
数据 库 管 理 系统 和 正确 的 数据 库 建 立 连 接 。 接 下 来 ， 我 们 将 给 出 - - 些 在 ORACLE 和 DB2 UDB 
中 使 用 SQL-99 的 例子 。 在 完全 SQL-99 中 连接 到 SQL 数据 库 的 语法 如 下 : 

EXEC SOL CONNECT TO target-server CAS connect-name] {USER Username]; 
或 

EXEC SQL CONNECT TO DEFAULT:; 
"target-seryeT” 是 由 数据 库 管 理 员 提 供 的 一 个 字符 串 名 , “connect-name” 是 你 为 这 次 数据 
库 的 连接 所 起 的 一 个 和 名字 ， 以 后 将 引用 到 它 【 一 次 有 不 只 一 个 连接 打开 是 可 能 的 )， 
“usermname” 是 鉴别 你 是 否 为 数据 库 用 户 的 一 个 学 符 电 。 当 你 不 需要 在 程序 中 引用 到 connect- 
name 时 ， 你 只 有 一 个 连接 打开 ， 那 么 就 可 以 使 用 CONNECT TO DEFAULT 格 式 。 因 为 不 同 

容 在 用 户 识别 、 权 限 要 求 方面 的 可 变性 ，Connect 语 和 句 并 不 是 Entry SQL-92 和 Core SQL-99 

的 一 部 分 。 然 而 ，SQL-99 的 连接 管理 特征 提供 了 Connect 语 名 的 标准 的 使 用 方法 ， 正 如 我 们 


在 后 面 所 见 到 的 。 
在 ORACLE 和 DB2 UDB 中 ， 字 符 串 常量 通常 不 能 用 作 Connect 语 句 的 参数 。 我 们 需要 如 下 
的 声明 ， 


exee sg9l begin declare section: 
: i* unallied declarations wi 
char user_name[i0],. user_pwd[ll0}: 
Exec sq91 end declare section: 


假设 口令 为 “XXXX”， 我 们 将 以 如 下 语句 对 上 述 变 量 初始 化 : 
strepyruser_name, "ponetlsql™): 有 set User_ name string 本 1 


strepy tuser pwd, AXXX"): tn ay 


那么 在 DRACLE 中 航 人 式 SQL 的 Connect 语 人 名 为 ， 
exeEe sql connect :user_name identified by :user pwd: -- DRACLE form of Connect 


对 于 同样 的 声明 ， 在 兼容 SQI.-99 连 接管 理 特征 的 数据 库 系 统 。 诸如 DB2 UDB 中 ， 若 机 连 
接 到 数据 库 mydpb， 应 该 书写 如 下 语句 : 


ExEc sql connect to mydb user :user name using :USer_pwd: 
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数据 库 的 名 字 同 样 也 可 以 通过 一 个 声明 的 字符 绅 变 基 给 出 。 当 上 用 户 名 或 口令 不 需要 时 ， 
DB2 UDB 也 人 允许 一 个 没有 用 户 名 或 口令 的 较为 简短 的 格式 。 注 意 ， 在 这 一 SQL 语句 中 使 用 福 
主 变 量 作 为 参数 时 所 用 到 的 冒号 。 断 开 与 数据 库 连 接 的 基本 SQL 语句 SQL Disconnect 的 格式 
如 下 : 

所 其 人 S91 disconnaect connect-name: \ 
或 

exec 591 disconnect current: 

然而 ， 在 使 用 Disconnect 语 多 之 前 ,必须 对 成 功 的 事务 执行 Commit 语 名 ， 或 对 不 成 功 的 
事务 执行 Rollback 语 句 撤销 不 成功 事务 中 已 做 的 部 分 工作 : 否则， 斯 开 连 接 操 作 会 失败 。 我 们 
将 在 5.4 节 中 详细 介绍 Commit 和 Rollback 语 名 。 这 里 我 们 只 是 简单 地 提 - -: 下， 对 于 成 功 的 任务 
结束 Commit 与 Disconnect 之 间 的 重要 组 合 。 


pxEC 391 COMmmit work: 
exec S91 disconnect current: 


以 及 对 于 失败 的 任务 结束 ，Roilback 与 Disconnect 连 接 之 问 的 重要 组 合 . 


exec Sql roliback work: 
exec 39l disconnect current: 


ORACLE 中 有 一 条 语句 同时 执行 一 条 Commit 和 一 条 Disconnect: 


ExEC 591 commit release: -- DRACLE form of success Disconnect 


在 ORACLE 版 本 7 之 后 就 必须 使 用 这 种 格式 的 Disconnecti 洛 机。 如 果 Diseonnect 是 在 一 个 严 
重 错误 之 后 ， 我 们 就 使 用 下 面 的 格式 释放 连接 (Rollback 和 Disconnect ): 


exXEC 日 ] rollback release; -- DRACLE form of tailure Disconnect 
DB2 UDB 婚 有 SQL-99 格 式 的 释放 连接 诸 铝 ， 也 有 自己 如 下 的 释放 巡 接 古人 名 格式 : 
Exec sql connect reset: -- DBE2 UDB form of suctcess Disconnect 


例 5.1.1 给 出 了 目前 为 止 介绍 的 能 人 式 SQL 特 征 和 一 些 新 的 概念 。 为 简单 起 抑 ， 在 这 个 例 
子 以 及 大 多 数 例 子 中 ， 我 们 都 会 忽略 由 于 程序 错误 无 效 的 数据 库 估 息 或 不 止 确 的 用 上 户 输 人 而 
导致 运行 中 可 能 出 现 的 错误 。 在 例 5.1.1 的 程序 中 ， 我 们 对 执行 嵌 人 式 SQEL 博 癌 时 可 能 产 牛 的 
错误 用 两 条 语句 作 了 处 理 ，exec sql include sqlea 和 exec sql whenever 
sqlerror goto report_errore 在 程序 开始 ，exec sql include sglca 语 全 为 特 
定 的 错 谋 和 统计 和 信息 分 配 空间 ， 它 同 数据 亩 系统 监测 之 间 进 行 通 信 ， 称 之 为 通信 入 
(commmunication area)。 对 子 真正 支持 SQL-99 的 系统 来 浇 ， 它 是 不 而 去 的 ， 然而 自前 的 系统 通 
常 都 需要 它 。exec sql whenever sqlerror goto repaort_erreor 语 名 建立 了 一 个 
错误 中 妖 条 件 ， 使 程序 在 发 生 这 一 错误 时 跳 转 到 显示 数据 库 出 错 信息 的 代码 处。5.2 证 介绍 了 
SQL 出 错 处 理 。 

例 5.1.1 潜 虑 图 5-1 所 示 的 嵌入 式 SQL 程 序 。 程 序 不 断 提 办 用 户 输 人 人 -- 个 顾客 的 cid， 显 
示 顾 客 的 名 字 和 应 有 的 折扣 作为 回答 ， 当 用 户 输 人 一 个 空 字 等 串 时 程序 终止 。 

图 $-1 中 的 大 部 分 语法 已 经 介绍 过 了 。 字 符 串 变量 的 格式 将 在 下 一 小 和 中介 绍 ; 己 用 户 交 互 
的 函数 prompt0 也 将 在 后 面 的 小 节 中 介绍 。 注 意 刘 main0O 困 数 的 循环 语句 最 后 ， 即 在 从 表 中 进 
行 了 一 系列 的 读 操 作 之 后 ， 而 在 任何 一 个 与 用 户 交 互 的 动作 (如 显示 结果 ) 之 前 ,执行 语句 
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exec sqi commit work。 在 本 章 的 后 面 将 会 说 明 ， 在 某 一 条 记录 数据 被 读 时 ， 必 须 对 这 
一 条 记录 加 锁 来 防止 由 于 其 他 用 户 更 新 数据 库 而 导致 提供 给 读 取 数据 库 的 用 户 不 一 伺 的 数据 
人 祝 图 。 我 们 需 则 在 循环 中 找到 某 处 释放 这 些 读 锁 ， 以 免 它 们 无 限制 的 累积 从 而 导致 其 他 用 户 
不 能 够 更 新 那些 很 早 就 已 被 读 耻 了 的 记录 。 释 放 锁 的 一 个 好 时 机 就 是 在 与 用 户 交 互 之 前 。 


#include <stdio,h> 











1:* header for prompted-input function *f 
#include “prompt.h" 

A:* header for database system’s SOLCA structure | 
ExeEc S91] Tneclude sqlca: 

char cid_ prompt[}] 一 “Please enter customer id: ": i** decilaration Unknown to SQL wi 


fnt maint } 


{ 









exec Sql begin declare section; A* declare SOL host variables nF 
char cust_id[S1, cust_name[L ld]; i* character strings A 
fl1oat cust discnt: A* Host var for disent value wf 
char user name[20], user_pwd[20]; i* for Connect “Af 






exec S91 end declare section: 







eet S01 whenever sqlerror goto report_ error:; i error trap condition Ff 
eXxec S91 whenever net found geto notfound: i* not tound condftion wi 






strcpytuser_name, "poneilsgl”"}): 






strepytuser_ pwa, "XXXX™Y), 





EXEE S01 Connect :user_name 







identified by :user_pwd; fh ORACLE Connect id 
whilet tprompttcid.,prompt, 1, cust id, 4)) DS= DU A* main Toop: Tinput cid 3 

exet S91 Select cname, discnt 
into :cust name, :cust. discnt A retrieve cname, discnt wf 







FO GUStONers wherg tld = cust.1d: 








EXEC SF] conmmit work; i* pelease read lock on row * 
printft"Customer's name is %s and discount is 和 5 .1fAn”。 A* print values nf 
cust_name, cust_discnt}: 7 二 NOTE: no initial colons «Ff 
tontinue: i* back to tap of 100p 二 
notfound: printfi"can’t find customer %s, continuing\n™ .cust _ id}; /* 100p again nf 
} i* end of main TOop 


站 DORACLE Diseonnect from database */ 





ExeEe S91] commit release: 







return 总 ; i:* Thndicate success of program 本 
report _error: 

print_dberrort }; i* print out error message tp 

ext sql rollback release: A* ORACLE Disconnect in error wi 

i* indicate failure of program + 





return 1: 





图 5-1 ORACLF 概 入 式 SQL 程 序 


print_dberror(} 轴 数 显 示 数 据 库 节 统 的 错误 消息 ， 如 ORACLE 中 的 “ORA-00942:table or 
View does not exist”( 表 或 视图 不 存在 }。 在 附录 B.2 中 给 出 ORACLE 和 DB2 UDB 中 的 


print_dberror0O 明 数 的 代 体 。 


-Te er en 
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注意 到 只 有 那些 以 0RACLE 开 头 的 注释 行 所 对 应 的 语句 才 是 使 用 了 了 ORACLE 特征 的 合法 ， 
即 Connect 和 Disconnect 语 句 。 其 他 所 有 的 exec sgl 语 句 行 都 是 在 各 个 数据 库 系统 之 间 可 移 
植 的 。 对 于 DB2 UDB 和 数据 库 abc， 应 将 Connect 语 句 替 换 成 如 下 形式 ; 

Exec S01 connect to abc User :USer_Tame usiny :user_pwd: -- DB2 UDB tonnect 
或 者 如 果 你 的 数据 库 使 用 操作 系统 所 提供 的 用 户 授 权 ， 那 么 就 使 用 较为 简单 的 格式 : 

exee 50t connect to abe; -- DB2 UDB connect, simple form 
将 ORACLE 的 成 功 的 Disconnect 替 换 成 如 下 形式 ， 

EXEC sq] connect reset: -- DBe UDB success Disconnect 
或 者 SQI-99 的 格式 : 


EXEC S91 commit work: 
EXEC S91 dstonnect current: 


最 后 只 需 将 这 两 行 中 的 commit 替 换 成 roliback 就 完成 了 事务 失败 情况 下 的 
Disconnect 功 能 。 到 

(3) 数据 库 系 统 和 和 C 语 言 中 的 字符 串 

这 里 我 们 通过 图 5-1 的 程序 给 出 如 何 妈 理 字 符 串 。 由 于 CC 语言 和 数据 库 对 字符 串 的 外 理 是 
有 区 别 的 ， 因 而 这 是 一 项 复 淋 的 工作 。 

C 语 青 字 符 串 是 由 一 个 字符 类 型 值 的 序列 构成 的 ， 一 个 8 位 的 整数 ， 即 一 个 字 节 代表 一 个 
单独 的 字符 编码 ， 字 符 串 以 一 个 空 字 节 〔〈 所 有 8 位 都 为 0 ) 作为 结束 。 正 是 由 于 这 个 原因 ，C 语 
言 中 的 字符 串 有 时 被 称 为 以 空 字符 结束 的 字符 串 。 在 C 中 大 多 数 的 字符 编码 值 是 用 由 单 引 叶 括 
起 来 的 字符 所 代表 的 。 如 ， 字 符 代 码 'e' 代 表 了 ASC 了 字符 编码 中 的 整数 99， 而 字符 并 码 'O' 代 
表 了 整数 值 48。 空 字符 串 用 "\0' 表 示 ， 整 数值 为 0。( 不 要 洽 消 空 字 符 \0' 和 SQL 中 的 空 值 。)} 

按照 惯例 ， 所 有 C 语 言 库 的 字符 串 函 数 都 要 求 使 用 以 空 字 符 结 束 的 字符 串 。 在 [5.1.3] 的 初 
始 化 语句 ， 声 明和 初始 化 了 一 个 5 个 字符 的 数组 cust_id[5]， 字 符 串 的 值 为 “ce001”, 产生 了 如 
了 的 字符 数组 


we TTT 


一 个 字符 串 常量 ,例如 “c001”"， 包 含 在 双 引 号 内 ， 代表 了 一 个 指向 由 C 编 译 程 序 建立 的 以 
空 字符 结束 的 字符 串 ， 同 样 一 个 数组 名 如 user_name 是 指向 它 内 容 的 一 个 指针 。 一 般 情况 下 ， 
C 语 言 中 的 字符 串 是 通过 它们 的 字符 串 指针 来 处 理 的 。 如 在 图 5-1 程 序 中 使 用 的 strepy0) 疯 数 : 


strepy{tuser name, “poneilsgql"): 


将 右面 字符 串 参 数 中 的 所 有 字符 依次 复制 到 左边 的 字符 串 参 数 《 一 个 末 被 初始 化 的 字符 数组 ) 
中 ， 包 括 终止 符 %0'。 如 果 函 数 调用 找 页 或 显示 一 个 没有 空 字符 结尾 的 字符 串 ， 它 的 处 理 将 党 
试 由 字符 串 指 针 所 指 的 位 置 开始 ， 直 到 过 到 某 一 8 位 都 是 0 的 字 节 ( 空 字符 ， 即 0' )。 

数据 库 系 统 通常 在 Create Table 语 句 中 以 chartm 或 Yarchar(n) 的 类 型 声明 的 列 中 使 用 完全 不 
同 的 格式 代表 字符 串 。 例 如 ， 在 表 customers 中 ， 列 cia 的 类 型 定义 为 char(4)， 占 用 了 4 个 
字符 ， 没 有 空 结束 符 。 如 果 我 们 在 customers 中 插入 新 的 一 行 ， 其 中 cia 的 值 设 置 为 "c9" 
(本 章 后 面 我 们 将 介绍 如 何 实 现 这 一 操作 )， 那 么 在 cid 中 实际 存 屠 的 字符 为 'c'，'9'"，'',!'，'， 
最 后 两 个 字符 用 空格 填充 。 因 为 数据 库 事 先知 道 字符 串 的 长 度 ， 所 以 这 里 并 不 需要 空 字符 结 
束 符 来 标记 字符 串 的 结束 。 数 据 库 中 的 列 着 是 变 长 字符 串 类 型 ， 如 表 customers 中 的 cname 
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列 的 字符 串 长 度 不 是 一 个 常量 ; 由 一 个 2 字 节 长 度 的 整数 计数 器 来 从 字符 串 涉 开始 记录 字符 个 
数 。 由 于 有 了 这 全 计数 器 ， 同 样 也 不 需要 空 字符 结束 符 标 记 宇 符 串 结果 。 

目前 当 用 杉 人 式 SQL 诸 名 将 字符 串 列 中 得 到 的 值 读 到 C 数 组 时 ， 大 和 多数 的 数据 库 系统 会 把 
列 值 转换 成 以 空 字 符 结 束 的 字符 串 ， 这 样 C 语 言 就 能 够 正常 地 处 理 这 一 字符 品 。 这 意味 着 要 从 
SQL 中 接受 字符 串 列 值 的 C 数 组 蛮 量 必须 能 有 足 铝 的 数组 空间 容纳 相应 表 列 值 的 每 一 个 字符 ， 
包括 \0'。 在 第 3 章 的 Create Table 语 名 [3.2.1] 中 定义 了 表 customers 的 cid 列 类 型 六 chari4)， 
所 以 在 [5.1.3] 的 Declare Section 语句 中 对 cust_ig 的 声明 如 下 : 

thar Cust. id[5] 

一 些 数据 库 系 统 不 能 完成 这 一 转换 是 很 可 能 的 。 如 果 你 发 现 从 数据 库 中 得 到 的 字符 串 打 
纯 出 来 带 有 “垃圾 ”"， 就 应 该 查看 一 卜 所 使 几 的 数据 库 系 统 的 正确 转换 规则 。 

{4) 提示 用 户 交 互 

我 们 将 解释 在 例 15.1.1} 中 提 到 的 出 十 多 示 用 户 进 行 交 互 的 promptO 畏 数 (这 一 函数 的 C 代 
人 码 在 附 了 水 B.1 中 给 出 )。 在 例 $.1.1 中 循环 的 开始 是 这 样 的 : 

whilerttprompttcid Promnpt，1I。cust id。47) Y= 0) 

恩 数 promptO 将 问 用 户 显 示 在 cid_prompt 数 组 中 的 消息 ， 这 -- 数 据 口 在 程序 前 面 被 初始 
化 过 六: 

Please enter customer id: 

用 户 键 入 的 对 这 一 提示 进行 响应 的 任 一 行 都 被 解释 成 用 空白 符 分 隔 开 的 连续 标记 {token)。 
空白 符 包 括 一 个 或 多 个 空格 、 跳 格 或 是 换行 符 ， 在 C 中 分 别 以 ''、'，"n' 来 表示 。 标 记 层 内 部 
没有 髋 人 空白 符 的 字符 只 。 在 输入 的 字符 串 中 ， 多 个 标记 是 用 空白 符 { 通 常 是 空格 ) 来 分 隔 的 。 
在 例 5.1.5 中 ， 函 数 promptO 期 望 得 到 一 个 标记 ( 因为 函数 的 第 二 个 参数 为 1 )， 然 后 将 它 读 到 
cust_ia 数 组 中 【第 3 个 参数 )， 数 组 可 容纳 4 个 宇 符 【第 4 个 参数 ) 加 上 1 个 空 字符 结束 符 .。 
因此 ， 如 果 用 启 让 看 到 提示 信息 后 键入 

O03 
cust__id 将 被 填充 成 -- 个 C 字 符 串 “c003”。 如 果 用 户 键入 

SON wxy2aheder 
cust_id 会 得 公 同 样 的 值 。 在 这 里 ，prompt0) 函 数 仅仅 查找 一 个 标记 ， 当 看 到 第 一 个 时 ， 就 
将 它 返 回 。 现 在 如 果 用 户 在 提示 行 上 键 人 一 个 简单 的 回 车 ， 或 者 一 个 过 分 长 而 不 能 全 部 放 人 
数组 内 的 字符 串 ( 多 于 4 个 字符 )， 那么 返回 结果 会 小 于 0， 并 且 循 环 中 的 While 条 件 将 会 屁 
FALSE， 循 环 将 终 相 。 这 里 ， 在 提示 行 键入 回 车 是 推荐 的 - 种 结束 提示 循环 的 方法 

图 数 promptO 也 可 接受 用 户 输入 的 才 个 标记 。 例 如 ， 图 $-13 的 程序 提示 输 人 两 个 账 导 字符 
果 和 一 个 美元 金额 。 要 想 了 解 函 数 promptO 重 复杂 的 使 用 方法 和 它 的 源 代 码 可 以 参考 附录 B.1。 

(3) 预 编译 和 编译 过 程 

我 们 在 前 面 提 到 过 ，C 诸 言 编译 程序 不 能 识别 诅 入 式 exec sal 语 句 的 诸 法 ， 所 以 源 程 序 
必须 先 通过 预 编译 程序 将 这 些 舱 入 式 语句 转换 成 C 中 的 正确 语句 。 阁 想 获 得 则 多 的 信息 ， 可 矢 
考 附 录 B.3。 

2. 使 用 游标 进 树 多 行 

只 有 当 Select 语 名 保证 每 次 最 多 读 一 行 到 一 个 列 变 量 的 集合 时 ， 才 能 使 用 例 5.1.1 中 的 诅 信 
式 Select 语 名 格式。 我 们 如 何在 程序 中 检索 多 行 呢 ? 使 用 交互 式 查 询 从 表 中 检索 多 行 显示 到 屏 
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幕 上 是 一 件 比 较 容 易 的 事 ， 但 是 在 程序 中 我 们 必须 明确 指定 要 将 每 一 行 的 每 一 列 放 区 在 哪里 ， 
这 样 我 们 就 可以 通过 和 名字 米 访问 。 可 以 想到 ， 我 们 可 以 通过 声明 数组 然后 检索 所 有 数据 行 到 
这 些 数 组 ， 但 这 不 是 一 个 好 方法 一 一 我 们 一 般 不 可 能 预先 知道 这 些 数组 应 该 有 多 大 ， 其 至 也 
不 知道 检索 出 来 的 数据 是 否 能 一 次 全 部 放 人 一 个 基于 内 存 的 数组 中 。 实 际 上 ， 你 应 该 把 这 一 
轧 作 为 说 人 式 5QL 编 程 的 原则 。 

一 次 一 行 原则 ”在 租 人 式 SQL 程 序 中 ， 每 当 检 索 未 知 数量 的 行 时 ， 程 序 员 应 该 假设 这 些 记 
采 不 能 一 次 全 部 放 人 任 - : 卢 明 过 的 数组 中 ， 并 且 程 序 的 设计 也 应 该 反映 出 这 ~- 假 设 。 

如 何 处 理 末 知 个 数 的 行 这 一 -问题 让 我 们 想到 了 从 文件 中 处 理 未 知 个 数 的 输入 值 的 方法 ， 
我 们 通常 是 表 过 一 个 循环 每 次 处 理 一 个 值 。 由 于 程序 是 以 顺序 的 、 每 次 一 步 的 方式 执行 的 ， 
很 显然 ， 从 -条 Select 语 名 中 我 们 总 是 每 次 查看 一 行 。 当 我 们 在 未 知 个 数 的 行 上 执行 Select 语 
各 时 ， 每 次 从 记录 集中 检索 一 行 ， 需要 一 个 游标 记录 当前 位 置 。 

对 一 个 出 用户 交互 提供 的 cig 所 唯一 确定 的 特定 客户 ， 我 们 想 亚 检 索 列 出 为 该 客户 提供 
订货 的 代理 商 a- a 的 一 行 ， 同 时 列 出 每 个 代理 商 所 提供 给 客户 的 订单 金额 总 和 值 。 下 面 我 们 声 
明 一 -个 名 为 agent_dollars 的 游标 来 取代 简单 的 Select 语 句 ， 

EXeC S01 declare agent_doliars cursor for 

select ald, sumldollars)y from orders 
Where cid = :cust id group by aid: 

Declare Cursor 语 名 通常 意义 上 是 一 个 声明 ， 它 一 般 放 于 程序 中 较 前 面 的 地 方 。 在 游标 被 
声明 之 后 ， 它 仍然 不 是 活路 状态 。 在 程序 开始 检索 信息 之 前 ， 必 须 执 行 一 条 SQL 语 句 来 打开 
这 个 游标 。 游标 被 打开 之 后 ， 程 序 就 可 以 使 用 取 (fetch) 操 作 从 汶 标 处 每 次 检索 一 行 ， 当 程序 
完成 了 检索 之 后 ， 应 该 立即 关闭 游标 。 首 先 ， 看 一 下 打开 游标 的 语句 : 

exec Sql open agent dollars: 

在 程序 运行 过 程 中 碰 到 Open Cursor 语 何 时 ， 问 数据库 系统 监测 器 发 出 一 个 调用 ， 以 玲 备 
执行 agent_doljiars 游 标的 Select 计 和 句 。 如 果 这 一 查询 依赖 于 -- 些 宿主 变 遇 (在 本 例 中 是 
cust_iqd), 那么 这 些 宿主 变 量 在 这 时 被 赋值 。 有 一 -点 很 重要 必须 认识 到 ， 坟 所 改变 
cust_id 的 值 将 对 检索 得 到 的 一 系列 行 不 产生 和 任何 影响 。 一 量 游 标 被 打开 了 了， 我 们 就 可 以 使 
用 如 下 的 Fetch 语 名 开始 检索 连续 的 记录 行 : 


exec sql fetch agent_dollars into :agent_id，:dol1ar sum: 


Select 计 名 中 的 INTQ 子 句 检 索 单 独 的 一 行 。 在 检索 多 行 的 情况 下 ，INTO 子 名 是 加 人 到 
Fetch 语 句 中 去 的 ， 而 不 是 作为 游标 的 一 部 分 被 声明 的 。 这 带 来 了 最 大 程度 的 灵活 性 ， 坟 为 可 
以 想到 我 们 可 能 会 在 不 同 的 情况 下 将 从 一 个 游标 取 行 值 到 多 于 一 个 的 变量 集合 中 。 很 明显 
INTO 子 句 属 于 Fetch 语 铝 ， 而 Fetch 诸 句 正 有 是 从 行 中 检索 值 。 由 于 对 于 一 次 打开 的 游标 数量 有 
限制 ， 困 此 当 一 个 游标 所 有 的 Feteh 语 伸 都 执行 之 后 ， 应 该 执行 Close Cursor 语 句 。 当 程序 结束 
时 ， 所 有 打开 的 游标 会 被 关闭 。 

游 徒 通 毅 可 以 被 看 做 是 指向 最 近 刚 刚 被 检索 到 的 行 ， 或 者 在 游标 第 一 次 被 打开 的 情况 下 ， 
恰恰 指向 位 十 第 一 条 记录 之 前 的 位 置 。 在 随后 的 提取 调用 中 ， 洲 标的 位 置 首 先 加 1， 然 后 这 条 
记录 中 的 值 被 检索 到 指定 的 答 主 变量 中 。 有 可 能 出 现 这 样 的 情况 ，-- 个 新 的 提取 操作 将 游标 
月 1， 发 现 没 有 行 可 被 检索 了 了， 这 一 事件 的 状态 裤 返 回答 程序 。 这 一 动作 与 许多 程序 从 文件 检 
索 任 意 数量 的 值 的 情况 完全 类 似 。 例 如 ， 在 C 中 ， 晴 数 getchar0 从 标 淮 输入 文件 中 检索 字符 ， 
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就 像 磁盘 文件 那样 工作 ， 员 是 这 里 是 从 键盘 读 肥 输入 。 如 果 标 准 输 入 文件 被 重 定 向 到 从 普通 
磁盘 文件 输入 ， 那 么 当 画 数 getehar0 在 读 取 文件 时 发 现 已 访 完 所 有 字符 时 ， 它 退回 一 个 特殊 的 
EOE 值 。 程 序 员 的 责任 在 于 检测 每 个 返回 值 ， 当 遇 到 BOF 时 ， 开 始 新 的 处 理 。 在 SQL 的 Fetch 
语句 中 ， 标 明 游 标 已 到 最 后 的 状态 不 是 通过 函数 返回 值 的 形式 来 表示 的 ， 而 基 通 过 特别 的 条 
件 处 理 方法 ， 我 们 将 在 下 - - 节 介 绍 。 

SQL 通信 区 : SQLCA 

SQL 通信 区 ， 或 称 为 SQLCA ， 是 一 个 已 被 虞 明 过 的 内 存 结构 { 忆 中 的 结构 )， 它 的 成 员 变 
重用 来 在 数据 库 系 统 监 视 融 与 程序 之 间 进 行情 息 通 信 。 虽 然 早 在 20 世 纪 90 年 代 初 ，SQL 标 准 
就 不 赞成 使 用 SQLCA 结 构 ， 但 是 这 一 -结构 仍然 在 商业 数据 库 产 品 中 广东 应 用 (如 ORACLE 各 
DB2 UDB 都 支持 SQLCA )， 所 以 在 我 们 的 程序 前 部 也 包括 了 如 下 语句 。SQLCA 在 艇 入 式 的 C 
程序 中 声明 ， 通 常 写 在 其 他 的 外 部 声明 语 名 前面， 使 用 如 下 的 Include 语 句 : 

exec sql include sqlca: 

接 下 来 的 例子 和 程序 都 将 解释 其 中 - …- 些 概念 。 

例 5.1.2 图 5-2 给 出 了 一 个 检索 多 行 的 程序 GROUP BY Select 语 名人 重出 了 代理 商 的 ID 值 ， 
以 及 南 这 些 代 理 商 提供 给 某 一 几 户 指出 的 顾客 的 订单 金额 总 值 。 与 例 5.1.1 不 同 的 是 ， 这 -- 程 
序 是 用 DB2 UDB 的 格式 来 与 的 、 很 容易 将 忆 改 成 ORACLE 的 恪 式 ， 只 要 改变 Connect 和 


Disconnect 语 和 句 。 国 
5.2 条 件 处 理 

Whenever 语 名 使 我 们 在 进 到 出 错 利 其 他 的 情况 (如 数据 已 被 谈 完 ) 时 ， 控 制程 序 的 运行 。 
通常 的 格式 如 于; 


ExXEL SDL WHENEYER condition dction: 
在 例 $.1.1 和 5.1.2 中 使 用 到 的 这 一 语句 的 例子 如 下 : 


和 .之 .1 exec sq Whenewer sqlerror goto report error; 


Wheneyer 语 可 的 作用 是 设置 一 个 “条 件 陷 苹 ”， 这 样 会 对 所 有 后 和 面 由 EXEC SQL 语 名 所 5 
起 的 对 数据 库 系 统 的 调用 日 动 检查 它 基 否 满足 出 错 条 件 。 如 果 存 在 这 样 的 出 错 和 条件， 各 必 须 
采取 相应 的 动作 ; 在 [5.2.1 中 ， 就 是 GOTO 动 作 . 
以 下 是 对 在 Whenever 语 条 中 出 现 的 条件 和 动作 的 说 明 。 
{1) 条 件 
* SQLERROR 在 由 Whenever 语 人 句 所 屠 盖 的 每 -条 EXEC SQL... 调 用 之 后 检测 是 否 有 出 错 
情况 。 这 些 错 误 通常 是 由 编程 错误 所 引起 的 。 错 误 代 码 的 意义 依赖 于 某 一 特定 的 PDBMS 。 
ORACLE 中 的 错误 代码 可 在 推荐 读物 [6] 中 找到 。 例 如 ， 执 行 exec sql connect 可 能 产生 的 
出 错 返 回 为 “-02019:databasellink) does not exist.””。 
* NOT FOUND ”执行 其 一 条 SQL 语句 ， 如 Feteh 、Insert 、Update 或 者 Delete ， 检 测 是 再 设 
有 记录 受到 这 一 SQL 语 名 的 影响 。 这 -条件 出 现在 Entry SQL-92 和 Core SQL-99 中 。 
"SQLWARNING 除了 上 述 的 NOT FOUND 条 件 检 测 之 让， 它 还 检测 - :个 不 是 错误 但 应 


合 ”这 个 生 件 曾经 出 现在 Enty SQL-92 中 ， 但 不 在 SQL-99 中 ， 它 已 出 SQLEXCEPTION 代 替 ( 虽 然 这 不 是 Core 
SQL-93 的 内 容 )。 这 是 表明 这 些 标准 缺乏 向 上 兼容 能 旋 的 极其 罕见 的 情况 之 一 。 
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引起 注意 的 条 件 。 注 意 ，SQLWARNING 并 不 是 Full SQL-92 的 一 部 分 ， 并 且 在 X/Open 
SQL 标准 中 也 不 是 必需 的 ， 但 它 被 定义 为 SQL-99 的 一 个 扩展 特性 ; 而且， 被 广汉 地 实现 
于 各 种 数据 库 产 品 中 ， 包 括 ORACLE、DB2 UDB 和 INFORMIX。 要 使 用 SQLWARNING 
可 能 在 你 的 程序 中 需要 exec sgl include sqlca (对 于 SQLERROR， 这 通常 是 不 
需要 的 )。SQL WARNING 的 例子 有 “在 集合 图 数 求 值 时 至 少 删 去 了 一 个 空 值 ”以 及 
“在 Select 语 名 中 一 个 列 值 被 截取 后 赋 给 了 一 个 宿主 变量 ”。 


#define TRUE 1 
gincliude <stdic.hy> 
#inciude "prompt.h" 
ExEt SS9] include s91ca; 
exete 91 begitn declare section: 
char cust id[5], agent_ 1d[#4]:; 
dnublie dollar sum: double float variabie 


axet sq1 end declare section: 


tat matnt } 
{ 
char cid promotf] = "Please erter customer ID: ™: 
exeet 59] dec1are agent_dollars Cursor for 
select aid. sumidolTars) from orders cursar for select 


where cid = ?rust _ 1d group by aid; note: depends on cust_id 


让 其 自己 $591 whenever sqlerror goto report_error: error trap condition 
exee 541 connect to testdb.: | DB2 UDB Cornnect, simplie Torm 
exec sql whenever not foungd goto finish: end of cyursor trap condtitien 
while tprompticid prompt, 1, cust _ 1d, #4; >= 0) [ main Toop. det cid from user 
exec S90 OpEN agent.dollars: cust_id value used in open cursor 
while CTRUEY { loop to fetch rows 
EXEC S91 feteh agent_dollars fetch next row and ..., 
tnto :agent_id, :dol1lar_sum: .2 SEt these variables 
printfe"™is Wil.2f\n", print out latest values 
agent_id, dollar_sum’); 
上 end fetch 10op 


firnish: exec 59l close agent_dollars; Cigse cursar when done 
eXet S91 Commit work; end locks on fetched rows 


} end of main loop 
exer sql disconnect current: Disconnect from database 
return 0; 

report_error: 
print dberrort ); print out error message 
exete $9] rollback work: failing, Undo work, end locks 
exec Si disconnect current: Disconneact from database 


return 1: 





图 5-2 检索 多 行 的 DB2 UDB 程序 ( 例 5.1.2 的 图 和解 } 


(2) 动作 
* CONTINUE 这 意味 着 对 于 相应 的 条 件 不 采取 性 何 动 作 ， 程 序 按 正常 流程 继续 。 


TT a + 
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* GOTO 标号 ” 它 的 效果 同 C 语 言 中 的 “goto 标号 ”语句 。 必 须 注 意 到 ， 这 一 标号 必须 在 
所 有 片 续 的 EXEC SQL 语句 到 文明 到 另外 一 .条 拥有 同样 条 件 的 Whenever 语 句 的 范围 内 。 
"STOP 这 -一 动作 早 束 程序 的 运行 ， 撤 消 当 前 的 事务 ， 并 且 断 开 与 数据 库 的 连接 。 它 并 
不 显示 了 出错 信息 ， 所 以 退出 程序 看 上 去 很 神秘 。 这 一 动作 在 DRACELE 和 JINFORMIS 中 都 
有 定义 ， 但 在 PB2 UDB 和 和 基本 SQL 中 没有 。 
* DO 了 明 数 (ORACLE )，CAELL 画 数 (INFORMIX ) 条件 引发 一 个 对 已 命名 的 C 范 数 的 调 
用。 这 一 明 数 返回 之 三 ， 程 序 的 控制 流程 从 引发 这 一 条 件 的 EXEC SQL 语 名 之 所 的 闭 一 
条 语句 继续 下 去 。 这 一 动作 在 DB2 UDB 利 基本 SQL 中 都 没有 定义 。 
1. Whenever 语 铅 : 控制 的 作用 域 和 流程 
我 们 来 描绘 一 下 项 编译 程序 如 何 通 过 在 后 续 的 运行 时 数据 库 系 统 调用 后 插 人 检测 来 实现 带 
有 不 同 于 Centinue 的 任意 动作 的 Whenever 语 句 的 条 件 隐 阱 功能 。 这 些 检 测 将 SQLCODE ( 与 特 
定 产品 相关 ) 或 SQLSTATE ( 可 移植 ， 已 被 标准 化 ) 与 各 种 不 同 的 值 作 比较 。 在 遇 到 一 条 
Whenever] 青 切 之 后 ， 预 编译 程序 在 顺序 扫描 源 文件 代码 中 的 每 一 行 时 执行 一 个 简单 的 逐 句 搜索 
和 捅 人 和信， 只 有 当 明 到 一 条 后 续 的 Whenever 辣 匀 覆 和音 了 前 面 的 Wheneveri 语 名 时 ， 才 可 以 改变 程序 
的 动作 。 特 别 注意 的 有 是， 如果 当 播 人 人 的 Whenever 语 名 枕 盖 了 原来 的 命令 时 ， 程 序 的 动作 并 不 跟 
随 控制 流程 。 


例 5.2.1 考虑 一 个 程序 文件 中 的 下 述 语 名 序列 。 


maint ) 
【 
exec Sl whenever sqlerror stop; i* first whenever statement 请 


goto sl 
EXecC 59] whenever sgqlerror continues; i overrides first whensver *} 
sl: exer sl update agents set percernt = percent + 1, 


} 


尽管 标识 $1 外 的 Update 语 句 是 在 第 一 条 Whenever 帮 名 的 作用 域内 由 Goto 所 转移 到 的 ， 此 
处 对 于 条 件 sqlerror 所 应 采取 的 动作 为 continue (第 二 条 Whenever 语 名 的 作用 }。 这 是 因为 
预 编译 程序 是 在 第 二 条 Whenever 语 名 的 作用 下 设置 的 检测 ; 控制 程序 的 因素 在 于 文件 中 语句 
的 位 置 ， 而 不 是 控制 流程 ， 预 编译 程序 是 不 知道 控制 流程 的 。 国 

注意 到 在 没有 Whenever 语 名 的 情况 下 缺 省 的 动作 是 Continue ， 意 味 着 不 需要 采取 任何 特 
殊 的 动作 ， 按 照 正 常 的 控制 流程 继续 。 此 时 没有 必要 通过 对 数据 库 调 用 的 检测 来 得 到 这 一 动 
作 。 可 以 通过 莉 盖 带 不 同 动作 的 WhenevYer 语 句 来 重建 这 一 向 省 动作 ， 如 例 5.2.1 所 示 : 

exee SS whenaver Sqlerror continue. 

我 们 在 使 用 Whenever 语 句 时 必须 注意 要 避 渴 无 限 循环 。 

例 5.2.2 避免 无 限 循环 。 以 下 的 入 和 码 断 在 一 个 孙 数 中 ， 该 函数 被 调用 来 在 散人 式 SQL 中 
创建 一 张 表 : 


exec 591 wherever sqlierror goto handie_error: 
EXEE S91 create table customers 
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teid charta4) not null, cname varchartl3)}, . . .7): 
如 果 由 寸 革 个 错误 (例如 ,磁盘 空 间 不 够 ) 而 导致 建 表 和 失败， 程序 的 控制 流程 转 到 了 如 
下 标号 的 程 订 段 : 


handie_error: 
ExEt S91] whenever sglerror continue: 
EXEC Sq drop customers.: 
Exet S91 disconnect: 
fprintftstderr, "Could not create customers table\n™): 
return -1; i* return error condition 二 1 
这 里 的 exec gg9gl whenever sqlerror continue 博 句 委 重要 ， 因 为 删除 表 
customers 可 能 会 引起 错误 一 一 实际 上 ， 如 果 我 们 没有 成 功 地 创建 囊 的 话 ， 这 是 很 有 可 能 发 
生 的 。 如 果 原 来 的 Whenevyer 语 句 还 在 起 作用 、 那 么 程序 又 将 跳 转 到 handle_errer 标 号 娃 ， 重 复 
学斌 Drop 语句， 不 停 地 循环 。 新 的 Wheneverj 在 句 覆 羡 了 Goto 动 作 ， 所 以 不 会 发 生 循环 。 
注意 ， 在 C 语 言 函 数 中 当 错 误 产 生 时 ， 正 山地 退出 处 理 是 很 重要 的 。 在 上 文 的 Pisconnect 
语句 之 后 ，return-1 语 名 退 回 了 出 错 的 信息 ,返回 0 则 表明 了 消 数 已 成 功 地 完成 。 在 收 到 返回 
值 - 1 以 后 由 程序 员 采 取 相 应 的 操作 。 一 般 在 Creare Table 语 名 失败 之 后 不 会 有 其 他 可 选 的 动 
作 、 所 以 在 这 种 情况 下 ， 一 个 带 警 告 值 的 正常 返回 可 以 指出 有 必要 采取 这 动作 。 加 
2. 显 式 的 错误 检测 
Whenever 机 制 的 基础 起 一 个 提供 了 更 多 与 条 件 有 关 的 信息 的 错误 编码 系统 。 不 六 的 丰 ， 
没有 可 以 完全 移植 的 方法 使 用 这 些 代 码 。 支 持 SQLCA 的 产品 要 填写 sqlca.sqlcode 
(SQLCA 结 构 的 一 个 成 员 )， 或 者 一 个 与 特定 产品 的 错误 公 相 关 的 SQLCODE 灾 晤 。 正 如 上 文 
提 到 和 的 ，SQL-92、SQL-99 和 X/OpenSQL 等 标准 一 直 都 反对 使 用 SQLCA， 仙 要 将 -种 新 的 报 
告 错误 的 方法 ， 称 为 SQLSTATE, 设置 为 标准 ， 但 是 一 些 产品 还 森 使 用 它 ， 或 者 在 缺 省 说 置 
时 不 支持 它 。 特 别 在 ORACLE 中 ， 它 要 求 预 处 理 程序 运行 时 必须 设置 选项 MOPE=aANST 才 能 支 
持 SQLSTATE。 在 例 5.2,3 中 我 们 看 到 ，DB2 UDB 提 供 SQLSTATE 作 为 SQLCA 的 一 个 成 员 ， 在 
标准 和 所 有 支持 它 的 产品 中 ，SQLSTATE 由 一 个 5 个 字符 的 字符 串 编码 而 成 ， 带 有 一 个 2 个 字 
符 长 的 “类 别 编 码 ” 和 一 个 3 个 字符 长 的 “ 子 类 编码 "。 例 如 ,“00000” 人 代表 没 有 销 误 ， 
“82100” 表 示 “ 内 存 溢出 ”， 对 于 所 有 的 产品 这 一 编码 都 是 相同 的 。 你 可 以 查阅 你 正在 使 用 的 
数据 库 系 统 产品 的 能 人 式 SQL 参 考 指南 来 得 到 你 所 使 用 的 数据 库 系 统 的 SQLSTATE、SQLCA 
和 SQLCODE， 来 确定 所 有 主要 的 出 错 条 件 ， 以 及 它们 是 如 何 被 报告 的 。 
如 果 Whenever 语 句 中 所 采取 的 动作 不 是 CONTINUE， 那么 要 在 执行 中 革 处 显 式 地 识别 出 
出 错 状 态 ， 这 通常 是 不 可 能 的 。 在 例 5.2.3 中 我 们 可 以 看 到 原 四。 


例 5.2.3 显 式 的 错误 检测 。 考 虑 下 面 的 代码 自 : 


exaect 3 日] begin declare section: 
char SOLSTATEELEY]: i -char SOLSTATE needs 6-:char C array */ 


ExeEC SU end declare section; 
ExXee S91 whenever solerror goto handle_error; A this 1s tn force below 二 六 


exec sql create table custs 


tcid chartd} not null, cname varchartliay, . . .): 
if Cetrempt SOLSTATE, "32100") 一个) A DORACLE, out Sf disk Space? 二 7 
<Call procedure toe handile this condit1ion» i MEVER REACH THIS bs 


-TTT—s i 
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注意 ， 预 处 理 程 序 在 语 各 Create Table 之 后 立即 设置 了 sqlerror 检 测 ( 例如 ， 
ifterrcode<0}goto hanale_error 来 实现 Whenever 语 句 。 岗 此 很 明显 strcmp 检 测 将 永 
撑 不 会 执行 到 距 在 这 一 比较 请 名 后面 的 行 。 风 henever 条 件 抢 焉 我 们 企图 间作 的 检测 之 前 。 这 
浇 明 了 如 果 我 们 想 要 识别 某 一 明确 的 出 错 条 件 ， 就 需要 丢弃 先 前 为 SQLERROR 所 灯 玫 的 GOTO 
动作 ,将 上 述 的 程序 修改 成 如 下 ， 变 动 处 用 和 斜体 表示 ， 


expec sql whenever sqlerror goto handle_error: i:* this TS in force below 各 
xeE Sol whenpever solerror Continue: it but this overrides it wy 
exee sql cereate table custs 

teid chartd) not null, cname varchartld), ...): A/* as above 本 
if cstrempt SOLSTATE. "2100™) =e0 }/ fr ORACLE, Sut of disk space? */ 

<call procedure to handie this condition» ir Pow this Works ff 
else if (stremp( SOLSTATE. “O0000"}1=0) 工 f+ another error? «jf 

getn handie_error; jr yes, handle 1t *f 
EXEr 50 whenerer sqlerror goto handie _ error; i gain jn force below wy 


在 DB2 UBB 中 ， 假 设 程序 的 exec sql include sqlca 语 句 生 黎 ， 那么 SQLSTATE 的 
值 可 从 sqlca .sgqlstate 的 SQLCA 籽 得 到 。 对 此 我 们 并 不 需要 一 个 声明 部 分 , 但 是 在 比 远 
时 必须 小 心 ， 因 为 SQLCA 中 的 字符 数组 只 有 5 个 字符 的 位 置 。 我 们 需要 使 用 strncmp 而 不 是 
sttcmp 使 字符 串 在 比较 了 5 个 字符 之 后 停止 : 


if {strncmptsdgica, sglstate, "B2100" .5}=—=0) 1x DB? UDB, out of disk space? */ 
call procedure to handie this condition»> A FoOWw FATS Works 二 
else 1f (strempt sgqlca. sqlstate, "OOOnD™} ld) { i another error? 二 
gaoto handle _ error: A yes, handie 1t 站 
联 
WhenevYer 语 名 的 优点 


Whenever 语 名 的 主要 价值 在 于 一 个 条 件 陷 阱 能 够 大 大 疾 少 处 理 错误 返回 的 代码 行 数 ， 另 
外 一 个 优点 在 于 Whenever 的 语法 可 以 在 各 个 不 同 的 数据 库 系 统 之 间 进 行 最 大 限度 地 移植 。 例 
如 ， 通 常 Fetch 循 环 和 Update 语 名 所 作 操 作 的 结果 是 不 确定 的 ， 因 此 可 以 利用 检测 条 件 NOT 
FOUND， 但 是 这 一 条 件 在 不 同 的 数据 库 产品 中 有 不 同 的 sgqglca.sglcode 值 (由 于 一 些 历 史 
原因 ， 这 一 值 通 常 为 100 }。Wheneveri 谨 名 将 总 是 在 适当 的 情况 下 被 解 发 . 

另 一 方面 ， 对 于 特定 的 数据 库 产品 又 可 能 在 所 有 的 数据 库 调 用 之 后 通过 对 SQLSTATE 、 
SQLCODE 或 sqlca .sqlcode 值 仔细 地 搬入 检测 来 检查 任何 标准 的 Whenever 条 件 。 的 确 ， 
这 些 检测 在 识别 特殊 条 件 。 和 指定 所 应 采取 的 动作 时 提供 了 更 大 的 灵活 性 。 

3. 处 理 错误 : 从 数据 库 中 获取 错误 入 息 

为 了 调试 程序 ， 经 常 需 要 访问 与 错误 返回 值 相 联系 的 由 系统 产生 的 错误 信息 。 我 们 将 扩 
充 例 5.2.2 的 handie_error 代 码 段 说 明 这 一 点 。 抽 取 错 误 信 息 的 确切 代码 顺序 依赖 于 你 所 使 用 的 
数据 库 系 统 。 在 SQL-92 中 曾 试图 将 这 些 方法 标准 化 《被 复制 到 SQL-99 )， 然 而 指定 的 复杂 方 
法 从 未 被 主要 的 数据 库 厂 商 所 采用 。 每 一 产品 都 应该 存在 一 个 可 与 下 面 的 DRACLE 代 码 厚 列 
比拟 的 方法 ， 我 们 已 在 例子 的 print_dberrorO 函 数 中 使 用 到 了 这 -- 帮 法 ， 可 参考 附录 B.2 得 到 
DRACLE 和 DB2 UDB 中 Print_dberror0 的 代码 。 


例 5.2.4 显示 ORACLE 中 的 铺 误 信息 。 首 先 我 们 需要 一 些 声明 : 
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Wdefine ERRLEN S12 i MaximUM length of an ORACLE error message ny 
jnt erriength = ERRLEN: 1:* size of bufter 二 地 
int errsizer A* ta contain actual meEssage Tengtt wd 
char errbuf[ERRLEN]: A:* buffer to receive MESSHOe «ff 


ORACLE 调用 sqlglm 抽 取 错 误 信 息 ， 并 且 将 实际 的 信息 长 度 返 回 到 errlength。 注 意 到 错误 
信息 不 是 以 空 字符 结尾 的 。 在 printf 中 使 用 了 * 特 性 用 第 二 个 参数 值 来 读 充 格式 长 度 。 


char errbuffERRLEN]: A* buffer toe receive message kf 
sg1lgim{errbuf, errlength, Serrsize):; 
printfe™ ,ron ,errsize,. errtbutfty; i* print just errlength chars Trom string 去 

| 
4. 指示 器 变量 


回忆 第 3 章 中 表 的 列 值 可 以 为 空 值 (除非 在 Create Table 语 句 中 该 列 被 声明 为 not null )， 并 
旦 空 值 在 列 类 型 所 取 的 正常 值 的 范围 以 外 。 例 3.7.8 中 ， 我 们 指出 语句 


select * from customers Where discnt <= 10 or disent >》 10. 


不 会 从 表 customers 中 检索 列 aiscnt 值 为 空 的 行 。 这 看 起 来 可 能 比较 奇怪， 由 于 可 以 这 人 么 
认为 所 有 的 值 要 么 小 于 、 要 么 等 于 、 要 人 么 大 于 10， 但 是 事实 上 ， 这 确实 是 正确 处 理 空 值 的 做 
法 。 回 已 空 值 代表 的 是 未 知 的 或 未 定 习 的 量 。 如 果 还 没有 为 一 个 磊 客 的 ai scnt 赋 值 ， 我 们 允 
不 想 把 aiscnt 的 值 认 为 是 <=10 或 >10 的 。 现在 假设 我 们 从 表 cuscomers 中 检索 行 的 discnt 值 
到 一 个 声明 为 int cust_qdiscnt 的 宿主 变量 (可 能 其 他 列 值 检 索 到 其 他 的 变量 中 )， 以 如 下 
要 入 式 Select 语 句 : 


exec 59] select discent, . . . into :cust discnt, . .. 


from customers Where tid = :cust id: 

想象 一 下 如 果 在 选取 的 行 中 的 aiscnt 值 为 室 ， 会 发 牛 什 么 样 的 情况 多数 现 代 的 数据 库 
产品 不 会 将 空 值 读 取 到 变量 cust_ disent 中 ， 但 是 如 果 人 允许 读 取 空 值 ,那么 C 变 量 
cust_discnt 将 得 到 某 种 位 模式 。 现 在 考虑 如 下 检测 : 

if {cust discnt <= 10 |! cust discnt > 10} ， 
(i 操作 符 是 Ci 语言 中 的 逻辑 运算 OR )， 如 果 cust_discnt 满 足 两 个 条 件 中 的 任意 一 个 ， 那 朗 
这 个 检测 中 的 if 语 名 为 TRUE。 然 而 如 果 cust_discnt 的 值 为 窗 ， 这 一 if 滞 名 就 会 有 问题 ， 因 
为 这 时 值 是 不 确定 的 ， 既 不 是 小 于 、 等 于 也 不 量 大 于 10。 记 识 到 这 一 问题 后 ， 现 在 多 数 的 数 
据 库 (ORACLE，DB2 UDB ，INFORMIX 给 编译 命令 提供 了 -icheck 选 项 ) 系 统 遵 循 SQL-99 的 
标准 ， 当 空 值 读 A 入 普通 的 宿主 变量 时 产生 错误 (例如 ，: cust_discnt， 它 没有 指示 器 变量 ， 
将 在 后 面 加 以 说 明 )。 

我 们 总 想 在 C 中 尽 可 能 地 模仿 SQL 的 还 生 ， 人 是 这 里 出 现 了 一 个 问题 。 为 了 尽 可 能 处 理 好 
空 列 伪 ， 我 们 需要 能 够 辨别 返回 的 变量 值 是 否 为 空 ， 我 们 可 以 写 如 下 域名 : 


if tnot-nulltcust discnt) Bh tcust_discnt < 10) ... fw TNHVALID **/ 


( && 运 算是 C 语 言 中 的 逻辑 运算 AND )。 然 而 ,实际 上 并 不 存在 名 为 not-null0) 的 冰 数 。 我 们 的 
意图 很 明确 ， 就 是 希望 有 一 种 检测 ， 在 cust_discnt 中 检索 到 空 值 时 ， 检 测 不 应 该 返回 
TRUE。 不 幸 的 是 ， 恋 量 cust_aiscnt 没 有 有 效 的 信息 来 告诉 我 们 它 得 到 的 值 是 否 为 空 ， 所 
有 有 效 信息 都 被 用 来 表示 从 属性 discnt 的 非 空 值 中 读 取 的 整数 值 。 因 而 我 们 需要 其 他 方法 记 
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未 cust_aiscnt 得 到 了 一 个 空 值 ， 在 SQL 中 使 用 的 标准 方法 是 随 着 变量 cust_di scnt 声 明 
一 个 指示 器 变量 。 我 们 将 这 一 指示 器 变量 命名 为 ca_ind。 这 里 我 们 用 了 如 下 的 声明 : 


xec S91 begin declare Section: 
fioat cust discnt; 
Shop int cd_ind:; 


exec Sql end declare section: 


现在 在 Select 语 名 中 ， 我 们 将 cust_discnt 的 引用 替换 成 cust_qiscnt 
:Ca inada 对 : 
exec Sql select discnt into :cust discnt :ed ind 
from customers Where cid = :cust_id: 


基本 SQL 人 允许 在 以 冒号 为 前 缀 的 名 字 前 加 一 个 可 选 的 关键 字 inaGicator 来 强调 发 生 了 什 
么 ， 所 以 男 一 种 可 选 的 格式 如 下 : 


exee sl select disent intoe :cust _ discnt indicator :cd ind 


from customers whera eld — :cust id: 


如 果 丰 使 用 关键 字 inqicator，ORACLE 要 求 这 两 个 宿主 变量 写 在 一 上 起， 中 间 设 有 空 隔 
{在 DB2 UDB 中 没有 如 此 要 求 )， 与 法 如 下 : 


Bxec Sql select discnt inte :cust discnt:cd ind i ORACLE form = 


from customers where cidgd = :cust Td: 


很 明显 多 数 可 移植 的 语法 使 用 了 关键 字 inaicator， 在 下 面 的 例子 中 我 们 也 这 样 做 。 在 
检索 之 后 ， 如 果 释 量 cd_inae 的 值 为 - 1， 意 味 着 变量 cust_discntc 得 利 了 一 个 空 值 ， 若 是 0 
则 意味 着 cust_discnt 中 的 倡 为 一 个 正常 的 整数 值 。 现 在 ， 我 们 在 前 面 提 到 的 逻辑 测试 ， 即 
对 cust_discnt 的 非 空 值 测试 ， 号 可 以 通过 对 这 一 指示 器 变量 值 的 测试 来 进行 了 。 我 们 可 以 
写成 : 

if Clecd_ind >= 0O) Ba cust_ discnt <= 10}. ..， 

仅 当 从 属性 aiscnt 中 抽取 刘 变 量 对 :cust_aeiscnt indicator:cd_ind 中 的 值 汐 非 
空 值 时 ， 对 c_ingq 的 测试 结果 值 才 是 TRUE。 

不 管 是 读 取 数 据 库 中 的 数据 还 是 更 新 数据 库 , 我 们 都 可 以 用 指示 器 变量 的 - 1 值 代 表 空 值 。 
例如 ， 要 将 表 customers 的 菜 一 行 的 discnt 值 设置 为 空 信 ， 我 们 可 以 这 样 写 : 


cd ind = -=1: 
Euec 号 全】 Update customers 
Set dischnt = :Cust discernt indfecateor :cd_fnd Where cid = :cust_id: 


指示 紫 变 量 还 有 男 外 一 种 标准 用 法 。 如 采 与 之 相关 的 宿主 变量 存储 的 是 一 个 字符 串 ， 并 
且 当 从 数据 库 中 检索 这 一 字符 串 时 为 了 使 它 能 在 宿主 变量 中 放下 载 取 了 字符 串 的 长 度 ， 那 么 
数据 库 系 统 会 将 指示 器 变量 设置 为 一 个 正 数值 (ind > 从。 比较 典型 的 是 ， 在 截取 之 后 这 一 正 数 
指示 器 变量 的 值 是 这 一 被 截取 的 数据 库 字符 串 的 长 度 。 因 而 ， 在 这 种 标准 用 法 中 ， 指 示 器 变 
其 的 可 能 值 如 下 : 

=0 数据 库 值 ( 非 空 值 ) 被 赋值 给 宿主 变量 。 

>0 将 一 个 被 截取 的 数据 库 字 符 上 串 赋值 给 一 个 和 害 主 变量 。 


202 数据 府 原 理 ， 篇 得 与 上 星 胡 


=-1 数据 库 值 为 空 值 ， 宿 主 变 芋 值 是 一 个 没有 意义 的 值 。 

显然 可 以 进一步 扩展 指示 器 变量 的 值 。 如 ，DB2 UDB 的 产品 中 ， 如 果 指 示 器 变量 的 值 为 
-2， 意 味 闭 是 由 于 一 个 错误 而 不 是 数据 库 中 存 鱼 的 值 而 使 检索 到 的 值 为 空 值 《 然 而， 必须 执 
行 一 些 特别 的 步骤 来 达到 这 一 对 指示 器 变量 的 扩展 ) 


5.3 一 些 通用 的 典 入 陈 SQL 语 名 


这 … 贡 我们 将 给 出 各 种 数据 操作 的 迄 人 式 SQL 语 句 的 一 般 格式 ， 我 们 从 一 个 对 嵌入 式 
Select 语 句 的 完整 介绍 开始 。 

1. Select 语 癸 

回忆 一 下 可 以 不 使 用 游标 在 程序 中 执行 Select 喇 名 ,但 是 这 只 能 在 最 多 检索 出 -一 行 记录 的 
情况 下 介 许 0 或 1 行 )， 如 果 这 一 Select 语 名 抽取 到 了 多 于 一 行 的 记录 ， 系 统 将 返回 一 个 运行 
期 错误 。 艇 人 式 SQL 的 Select 语 句 语 法 在 图 5-3 中 给 出 。 可 以 参见 第 3 章 得 到 对 于 语法 中 元 素 的 
介绍 ， 包 括 对 肥效 的 查找 条 件 (search_condition) 的 定义 . 注意 到 图 5-3 中 的 宿主 变量 
(host_variablel) 可 以 包括 指示 器 变量 作为 蕊 的 一 部 分 。 


EXEC SOL SELECT [ALLIDISTINCGT] expression {, expression... 
INTO host- variable 4, host-variable...,} 


FROM tableref [eorr_name] (, tableref Teorr_name |...} 
[WHERE search condition] 





图 5-3 基本 的 嵌入 式 SQL 的 Seleet 语 名 格式 【选取 单行 记录 ) 


由 于 使 用 能 人 式 Select 语 句 只 能 抽取 到 一 行 记 录 ， 交 互 式 的 SQL GRUOP BY、HAVING 、 
UNION 和 ORDER BY 子 句 并 不 包括 在 这 一 般 格 式 中 。 在 INTO 子 句 中 命名 的 变量 必须 与 所 检 
索 的 表达 式 是 一 对 一 的 对 应 关系 ; 由 于 自动 转换 并 不 总 是 做 所 有 你 认为 是 合理 的 事情 ， 所 以 
它们 必须 有 正确 的 类 型 。 在 ORACLE 中 ， 当 数据 库 中 的 字符 串 值 '1234' 被 检索 到 类 型 为 整 型 或 
短 整 型 的 C 变 量 时 ， 它 会 被 数据 库 系统 转换 成 数字 格式 。 同 样 ， 在 ORACLE 的 交互 式 SQL 或 红 
大 式 SQL 中 是 可 以 有 aty = '1000 这样 的 谓词 的 ,【 这 里 gt 是 一 个 正 数 类 型 的 齐 ， 而 '1000 
是 一 个 字符 串 常 基 )， 这 吓 因为 ORACLE 会 自动 将 字符 串 转换 成 整数 。 然 而 所 有 的 数据 库 产 品 
并 没有 对 这 种 字符 串 和 数字 类 型 之 间 的 转换 做 标准 化 。 如 果 要 依赖 这 些 转换 ， 你 必须 熟悉 你 
所 使 用 的 数据 库 系 统 所 支持 的 操作 。， 当 图 $-3 中 Select 语 名 检索 到 0 条 记录 时 ，SQLSTATE 和 
SQLCODE 的 值 将 被 设置 成 一 个 合适 的 警告 值 ， 并 且 将 触发 一 个 Whenever Not Found 动 作 。 

在 Select 语 句 和 下 面 将 介绍 的 其 他 语 名 中， 在 EXEC SQL DECLARE... 部 分 所 声明 的 福 主 
变 基 可 以 使 用 到 INTO 子 句 中 来 获取 检索 到 的 目标 列表 变量 (target list variable)。 图 5-4 给 出 了 
一 部 分 在 Create Table 命 令 中 定义 的 列 数 据 类 型 和 C 语 言 中 变 基 的 数据 类 型 之 间 的 对 应 关系 。 
有 关 SQOL 数据 类 型 的 更 大 的 -- 张 表 在 附录 A.3 中 可 以 看 到 。 注 意 ，float 类 型 在 C 和 SQL 中 是 不 
同 的 ; SQL 中 的 float 对 应 于 C 中 的 double 类 型 。 同样 ， 明 然 在 ORACLE 中 ，SQL 的 int 与 C 中 的 
int 类 型 是 兼容 的 ， 然 而 在 DB2 UDB 中 ， 需 要 使 用 C 中 的 long int 米 匹配 SQL 中 的 int 类 型 ， 从 而 
确保 它 足够 大 。 

在 EXEC SQL DECLARE 部 分 所 声明 的 宿主 变量 也 可 以 在 租 入 式 SQL 中 的 任何 
search_condition 语 法 中 使 用 。 然 而 ， 在 search_condition 中 的 箱 主 变量 只 能 用 来 表 
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示 表 达 式 中 的 数字 或 字符 串 常量 。 特 别 是 ,宿主 变量 不 能 容纳 字符 串 来 表示 更 复杂 的 语法 元 
素 ， 例 如 列 名 、 表 名 或 表达 式 中 的 逻辑 条 件 。 在 设置 了 宿主 变量 之 后 ， 编 译 程序 还 要 关注 这 
些 变 量 。 使 用 宿主 变量 字符 串 来 表示 这 些 元 素 甚 至 整 条 语句 的 功能 将 在 5.6 节 “动态 SQL” 中 
介绍 。 







To aa am 


nieper, nt integer, int, integer. nt int {DB2 UDB} 
eh numbert 10} “Be, 要 求 。 long int) 


doubiie precision, double prectsion, | double precisian, double 
floalt number, fleat double, float 


图 5-4 ”类 击 的 对 应 关系 ， 基本 SOL，ORACLE，DB2 UDB 和 C 








2. Declare Cursor 语 襄 

图 5-5 给 出 了 基本 SQL Declare Cursor 的 核心 语法 。 这 一 语法 的 太 部 分 与 图 3-13 中 的 交互 式 
Select 语 法 相同 。 子 查询 格式 人 允许 使 用 子 句 GROUP BY 和 HAVING， 也 可 以 包 售 宿主 变量 表达 
式 。 然 而 ， 大 多数 的 数据 库 系统 产品 不 为 在 目标 列表 中 检索 到 的 表达 式 提 供 列 别名 ; 其 实 这 
一 -功能 并 没有 多 大 的 价值 ， 因 为 一 般 在 做 人 式 语 句 中 不 用 显示 缺 省 表 ， 虽 然 有 时 责 要 在 
ORDER BY 子 句 中 提供 命名 的 列 。 然 而 ,通常 在 result_column 中 人 允许 使 用 整数 ， 用 一 列 在 结 
果 表 中 的 位 置 来 指明 该 列 。 


下 区 EC SOL DECLARE cursor_name CURSOR FOR 
SUbgquery 


[ORDER BY result_column TASC | DESCY {, result column LASC | DESC]...1] 
[FOR {READ ONLY | UPDATE [OF columnname {, columnname,..11}}: 





图 5-5 窒 人 人 成 5QL 的 Declare Cursar 语 法 


图 5-5 最 后 - 行 的 可 选 和 格式 用 于 指明 游标 是 READ ONLY 还 是 FOR UPDATE 的 。 如 果 两 者 
都 没有 被 指定 ， 那 么 在 缺 省 情况 下 ， 如 果 使 用 了 ORDER BY 那么 游标 是 READ ONLY ， 否 则 
游标 为 FOR UPDATE。 在 DB2 UDB( 和 Core SQL-99) 中 , 至 多 需要 选择 最 后 次 个 子 句 中 的 一 条 ， 
ORDER BY 或 者 FOR UPDATE， 而 ORACLE 允许 同时 使 用 这 两 个 格式 。( 然而 ， 在 ORACLE 
中 ， 使 用 子 句 WITH READONLY 在 ORDER BY 子 句 前 面 ， 而 不 像 FOR READ ONLY 子 句 在 
ORDER BY 子 刘 后 面 )。 如 果 程 序 的 逻辑 想 要 通过 游标 更 新 或 删除 一 条 记录 ， 在 游标 的 声明 中 
必须 包括 FOR UPDATE 子 名 《将 存 后 而 解释 )。 如 果 在 使 用 FOR UPDATE 时 没有 指定 列 ， 所 有 
被 选 到 的 列 都 被 认为 是 可 更 新 的 。 当 人 允许 数据 库 优 化 查询 时 应 该 使 用 READ ONLY 子 柯 。 如 采 
你 使 用 了 READ ONLY ， 逻 辑 上 就 认为 你 将 不 会 通过 游标 来 更 新 或 者 删除 记录 。ORACLE 和 
DB2 UDB 人 允许 在 ORDER BY 子 句 中 使 用 表达 式 ， 而 不 仅仅 是 一 个 列 名 。 

注意 到 前 面 定 闵 的 游标 只 能 在 一 个 行 集合 中 向 前 移动 。 在 SQL-99 中 消除 了 这 一 限制 ， 它 
新 增 了 一 个 可 滚动 游标 特征 ， 这 将 在 5.7 中 介绍 。 然 而 ，ORACLE 或 DB2 UDB 并 不 支持 这 一 功 
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能 ， 这 意味 着 要 第 二 次 抽取 某 行 记录 你 不 得 不 先 关 闭 然 后 再 打开 游标 ， 同 -- 游 标 可 能 在 一 个 
程序 中 被 连续 的 打开 和 关闭 多 次 。 通 常情 况 下 ， 游 标 在 被 再 打开 之 前 必需 关闭 (ORACLE 中 
对 这 -规则 有 例外 的 处 理 ， 将 在 下 文中 介绍 )。 

3, Delete 话 可 

有 两 种 格式 的 Delete 语 句 。 一 种 是 定位 删除 (Positioned Delete)， 它 删除 了 游标 所 在 的 当前 
记录 (最 近 被 抽取 的 记录 ) ; 另外 一 种 格式 是 查找 删除 (Searched Delete)， 尼 的 格式 同 我 们 在 
3.9 节 中 看 到 的 交互 式 SQL 中 的 格式 相间 。 图 5-6 给 出 了 这 两 种 删除 格式 的 语法 。 


EXEC SAL DELETE FROM tablename Leorr name] 


LWHERE search condition | WHERE CURRENT OF cursor. name]: 





图 5-6 由 人 人 式 的 基本 SQL Delete 语 法 


定位 删除 使 用 了 一 种 特殊 的 语法 CURRENT QF cursor name., 两 个 WHERE 吕 能 用 一 
个 ; 如 果 两 个 都 设 有 用 汉 ， 那 就 删除 表 的 所 有 行 ，corr name 用 在 search_cenaition 中 ， 
并 且 存 某 些 产品 中 如 果 它 与 定位 删除 一 起 使 用 ， 就 可 能 引起 运行 期 错误 。 在 使 用 SQLCA 的 系 
统 中 ， 若 选择 了 查找 删除 ， 那 么 长 整形 变量 salca.saqlerrd[2] 就 包含 了 删除 操作 所 影响 色 
的 行 数 。 如 果 没 有 行 被 影响 到 ， 那 么 Wheneyer 语 句 中 的 条 件 NOT FOUND 就 成 立 。 

在 定位 删除 中 ， 当 删除 操作 被 执行 后 ， 游 标 指 向 一 个 新 的 位 置 ， 如 果 删 除 后 还 有 记录 的 话 ， 
它 加 在 紧 跟 着 被 删除 行 后 面 的 那 行 之 兰 。 这 同 刚刚 打开 一 个 游标 时 的 情况 一 样 ， 游 标 恰 指 问 
Select 语 句 所 得 到 的 第 一 行 之 前 的 位 置 ; 选择 这 种 做 法 是 为 了 能 够 更 好 地 处 理 循 环 (就 像 我 们 在 
例 5.3.1 中 看 到 的 )。 如 果 执 行 删除 操作 时 ， 游 标 没 有 指向 某 一 行 ‘ 也 就 是 说 ,如 果 游 标 惨 指向 某 
一 条 记录 之 前 的 位 置 ， 或 者 Fetch 已 经 返回 了 NOT FOUND， 并 且 游 杯 指向 所 有 行 之 后 的 某 个 位 
置 ;， 系 统 将 返回 一 个 运行 期 绒 误 。 友 使 定位 删除 正常 工作 ， 在 删除 中 约定 的 游标 必须 已 经 打开 
并 且 指 向 一 个 实际 的 行 ， 删 除 中 的 FROM 子 名 必须 辣 选择 游标 时 的 FROM 子 名 中 所 指 的 是 同一 
张 表 。 另 外 ， 这 时 使 用 的 游标 必须 是 一 个 可 更 新 的 游标 ， 如 它 不 可 以 被 声明 为 READ ONLY。 


例 5.3.1 从 customers 表 中 删 队 所 有 住 在 Duluth 并 且 没 有 订单 的 (在 表 orders 中 没有 
出 现 ) 顾客 记录 。 我 们 可 以 使 用 查找 删除 非常 简单 地 完成 这 一 -操作 ， 使 用 如 下 语句 : 


eaxec Sq] delete from customers ¢ Where ccity = “Duluth and 
not exists (select * From orders o Where o.cid = c.cid}). 


我 们 也 可 以 使 用 游标 来 完成 这 一 删除 : 


Bxec sql dectare delcust cursor for 
select cid from customers c where ccity = Duluth’ 
and not exists (select * from Orders 0 where oa.cid = c.cid) 


for update of tio: Ai* Must declare cursor For update 太志 
whenever not found gato skip: A:* Tabel "skip” Ties later TI code 二 了 
exe 591 open delcust: 
while TARUEY 1 i* TRUE has Value 1: 100p forever *y 


exec sql fetch deTcust into :eust_ id; yz tf not Found, goto skip: Out of lo0c¢p 生子 
exec Sql delete from customers 
where current of delcust: /i* delete row under cursor x 


四 ht Wet Hi hl fr me leh ' 
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注意 ， 企 while(TRUE) 循 环 中 的 Delete 语 名 之后， 游标 指向 随后 一 行 之 前 的 位 置 。 不 管 删 
除 操 作 是 否 被 独行 了 ， 都 需要 循环 开始 处 的 Feteh 语 句 将 游标 通过 选 出 的 行 的 每 一 行 向 前 推进 , 
在 由 于 某 种 复杂 的 收 辑 条 件 删 除 操作 可 能 执行 也 可 能 没有 执行 时 ， 这 是 有 价值 的 缺 省 操作 ， 
因为 我 们 总 是 依 顿 取 操 作 在 循环 项 部 这 . -要 求 。 加 


可 以 修改 例 5.3.1 中 的 程序， 创建 一 个 游标 检索 所 有 下 过 订单 的 顾客 的 cityv 和 cia， 然后 
在 程序 逻辑 中 完成 测试 if {strcmp (city, "Dulutn")==0) 以 判断 这 行 是 否 应 该 被 删除 。 
然而 ， 由 于 性 能 上 的 原因 这 种 方法 可 能 是 错误 的 。 将 选择 的 准则 交 给 SQL 去 处 理 总 是 最 好 的 ， 
这 是 因为 ，SQL 在 执行 一 个 检测 时 能 够 不 带 有 额外 的 开销 (从 表 中 检索 值 然 后 把 它们 送 到 程 
序 中 ， 这 通常 是 很 费时 间 的 )。 的 确 ， 通 党 我 们 都 倾向 于 尽 可 能 将 所 要 司 的 操作 留 纵 SQL.。 在 
例 5.3.1 刚 开始 处 的 查找 删除 比 通 过 游标 使 用 定位 删除 来 完成 同样 的 任务 更 有 效 。 

4. Update 语 各 

与 Delete 一 样 。 有 黄种 形式 的 Update 语 句 。 一 种 是 查找 更 新 [Searched Update)， 类 似 于 交 
攻 式 中 的 多 行 更 新 语句; 男 一 种 是 定位 更 新 (Positioned Updqdate)， 通 过 游标 来 完成 更 新 。 查 找 
更 新 (参见 图 5- 了 7) 实质 上 等同 于 在 3.9 节 中 介绍 过 的 变 互 式 更 新 的 形式 ， 并 吾 这 种 形式 中 没有 出 
现 我 们 目前 还 未 介绍 的 元 素 。 


ExEt SOL UPDATE tablename Ecorr_naimhe] 


SET columnname = expr |, colummname 一 expr...} 


[WHERE search_condition]: 





图 5-7 租 人 式 基本 SQL 的 查找 更 新 请 法 


在 查找 更 新 中 ， 长 整形 变量 satca.sqlerrdf21 和 包含 了 更 新 所 影响 到 的 行 数 。 如 果 没 
有 行 被 影响 到 ， 那 么 多 henever 谨 名 中 的 NOT FOUND 条 件 就 成 立 。 

所 Delete 一 样 ， 要 使 定位 更 新 语句 (参见 图 S$- 多 正常 工作 ， 游 标 必 须 打 开 ， 在 Update 中 指明 的 表 
必须 和 Deciare Corsori 各 句 中 指明 的 相同 ， 并 且 游 标 必 须 指 向 有 效 的 记录 行 ， 而 不 是 指向 某 些 行 的 
前 而 或 后 而 的 位 置 。 另 外 ， 该 游标 必须 是 可 更 新 的 游标 ， 在 所 有 裤 Update 语 句 所 改变 的 列 上 声明 
为 FOR UPDATE。 如 果 这 些 条 件 中 的 任何 一 条 不 能 满足 ， 就 会 在 定位 更 新 语句 执行 时 返 匡 运行 期 


EXEE SOL UPDATE tablename 


SET columnname = expr {, Col UMNNname 一 expr...1 
WHERE CURRENT OF cursor_name:; 





图 5-8 构 人 人 式 基本 SQL 的 定位 更 新 硬 法 


5. Insert 庄 问 

Jnsert 语 名 只 有 一 种 单一 的 格式 ， 它 同 在 3.9 节 中 介绍 的 交互 式 版 本 的 Insert 语 句 相 同 , 在 
图 5-9 中 给 出 了 Insert 语 名 的 语法 . 不 过 , 有 两 种 播 人 形式 , 一 种 将 指定 的 值 插 入 某 一 单个 行 中 ， 
男 一 种 可 能 将 从 一 条 普通 的 子 查 询 语 包 中 得 到 的 值 插入 到 多 行 中 。 在 道 过 子 查询 插入 的 格式 
中 ， 长 整形 变量 sqlica.sglerrd[2] 包 含 了 被 影响 到 的 行 数 。 如 果 没 有 记录 被 影响 庆 ( 例 
如 ， 子 查询 返回 0 行 )， 那 么 Wheneveri 语 句 中 的 NOT FOUND 条 件 就 成 立 。 
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EXEtC SOL INSERT INTO tablename [recolumnname {, columnname...})] 


{YALUES texpr {, expr}} | Subquery}: 





图 5-9 散人 人 式 基 本 SQL 的 Insert 语 法 


证 我们 考 虚 一 下 为 守 么 没有 定位 插入 ， 如 INSERT,, ,WHERE CURRENT OF 
cursor_name;。 正 如 我 们 将 在 下 面 的 章节 中 看 到 ， 新 插入 的 一 行 通常 不 能 被 放 在 表 中 指定 的 
位 置 ， 而 是 放 在 由 表 的 磁盘 结构 所 决定 的 位 置 。 因 而 短语 WHERE CURRENT OF cursor_name 
就 会 处 理应 由 数据 库 系统 决定 的 将 新 播 人 的 记录 存放 在 哪里 的 问题 ， 这 是 不 合适 的 。 

6. 游标 的 打开 、 抽 取 、 关 闭 


10。 当 Open 语 句 被 执行 时 ， 数 据 库 系 统计 算 定义 — 

游标 cursofr name 中 WHERE 子 句 的 表达 式 值 并且 。 图 5-10 移入 式 基 本 SQL 的 Open Cursor 语 法 
识别 一 个 活动 的 行 集合， 为 后 面 的 Fetch 操 作 使 用 。 

游标 定 头 时 所 用 到 的 任何 宿主 变量 在 Qpen 语 句 执行 时 被 赋值 。 恕 果 这 些 值 后 来 有 所 改变 ， 这 
也 不 会 影响 活动 的 行 集 。 对 于 许多 数据 库 产 品 ， 如 果 游 标 已 经 被 打开 了 ， 就 不 能 再 一 次 打开 
它 。OQRACLE 对 这 一 规则 却 有 例外 的 处 理 ， 即 一 个 已 经 被 打开 的 游标 可 以 被 得 次 打开 ,并 日 
重新 定 尺 活动 的 行 集 。 


太一 个 打开 的 游标 中 抽取 话 动 行 集 
的 一 行 的 语句 格式 如 图 5-11 所 示 执行 EXEC SAE FETECH cursor. name 

c 语句 将 游标 定 INTO host-variable |, host-variablel}; 
Open Corsorii Pj: “CUTSOr_nNnamen 


位 到 活动 行 集中 第 一 行 之 前 的 位 置 。 随 图 5-11| 镀 人 式 基 本 SQL 的 Fetch 请 法 

后 的 每 一 条 Fetch 语 名 重新 定位 

cursor_name 到 活动 行 集中 的 下 一 行 ， 并 曙 将 行 (在 Declare Cursor 划 可 中 命名 ) 中 所 得 到 骸 列 

的 值 赋 纵 Fetch 语 名 中 所 命名 的 宿主 变量 。 为 了 使 Fetch 语 名 工作 ，cursor_name 必 须 已 经 被 打开 ， 

并 且 宿 主 变 雇 的 个 数 必须 与 游标 定义 中 的 目标 列表 的 列 的 个 数 相 同 。 当 Feteb 语 句 执行 时 遇 到 了 一 

个 空 的 活动 行 集 或 者 游标 位 于 最 后 一 个 活动 行 后 面 时 ，Whenever 埋 名 的 NOT FOUND 条件 成 立 。 
关闭 一 个 游标 的 语句 格式 如 图 5-12。 这 一 语 人 名 关闭 游标 ， 从 而 使 得 活动 行 集 再 也 不 能 被 访 


问 。 关 闭 一 个 没有 被 打开 的 游标 会 导致 错误。 
7, 其 他 嵌入 式 SQL 操 作 


在 接 下 来 的 部 分 将 介绍 一 些 其 他 的 扒 人 图 5-12 艇 人 式 基 本 SQL 的 Close Corsor 主 法 
式 SQL 语 句 。 我 们 已 经 介绍 过 的 语句 如 下 : 
这 些 语句 和 其 他 一 些 语句 的 语法 都 可 以 在 硕 录 C 中 找到 。 大 部 分 语 馈 的 语法 部 非常 简单 ， 然 而 
Create Table 诺 句 有 许多 语法 旋 素 现在 还 未 介绍 到 ， 需 要 更 为 详尽 的 解释 ， 这 些 将 在 第 6 章 中 介绍 。 
exec 9 create table 
exet 591 drop table 


PxXec sql tonnect 
PXEc #91 disconnect 


5.4 事务 的 编程 
在 第 3 章 中 .我 们 只 处 理 了 即席 交互 式 SQE 语 句 。 很 自然 我 们 会 考虑 创建 一 些 程序 ， 依 次 
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使 用 几 条 SQL 语 句 来 完成 单独 的 一 个 任务 。 在 这 一 部 分 ， 我 们 将 介绍 数据 库 事 务 的 概念 。 我 
们 将 看 到 有 时 需要 将 几 条 SQL 语 句 集合 成 一 个 不 可 分 割 的 要 必 全 有 要 公 全 无 的 事务 包 ， 并 且 
这 一 概念 使 编写 程序 的 方法 有 很 重要 的 分 支 。 

1. 事务 的 概念 

大 多 数 的 数据 库 系 统 允 许多 个 用 户 同时 执行 和 访问 同 - -数据 库 中 的 表 。 你 可 能 看 到 过 许 
多 用 户 在 不同 的 监视 器 工 与 同一 台 计 算 机 交互 (学 千 在 一 个 与 一 各 分 时 计算 机 相连 的 终端 房 
间 ， 银 行 职员 在 他 们 的 监视 器 上 上 上， 航班 订 香 代理 等 )。 计算 机 操作 系统 的 一 个 重要 任务 是 跟 竖 
这 些 用 户 ， 所 有 正在 运行 的 不 同 工 作 流 称 为 用 户 进程 。 数 据 库 系统 也 使 用 几 户 进程 的 概念 ， 
道 过 允许 多 个 进程 同时 访问 数据 、 这 称 为 并 发 访问 (coneurrent access)， 或 并 发 (coneurrency)。 

事实 证 明 蔡 没有 有 效 地 对 并 发 访问 进行 控制 ,用户 进 种 屿 可 能 看 到 一 组 永远 不 应 该 网 时 
存在 的 数据 元 素 的 集合 。 

例 5.4.1 数据 的 不 一 致 性 ”假设 一 个 存款 人 在 表 a 中 有 两 个 银行 账 导 ， 在 表 中 用 不 何 的 账 
导 ID 值 aiad， 分 别 为 1 和 a2， 来 代表 不 同 的 行 。 为 简单 起 见 ， 我 们 用 an,.balance 来 表示 
A.,balance where A.aid = An ( 必须 注意 ， 这 不 是 基本 SQL 的 符 导 )。 这 里 我 们 假设 开 
始 村 al .balance 为 $900.00、a2 .balance 为 $100.00。 现 在 假设 进程 P1 想 要 从 账号 Ad 中 取 
出 $400.00 到 A2， 来 平衡 两 个 账户 的 存款 。 为 了 完成 这 一 pe 首先 从 
Al 减 去 $400.00， 然 后 将 这 $400.00 加 到 A2。 因 而 我 们 在 这 一 过 程 中 有 三 个 “状态 


S11Al.balance == S300.00,72.balance == $100.,.00 
更 新 之 前 的 值 。 

入 中 1 .balance -= $500.00,BA2.bDalance == $100.00 
从 账号 A1l 中 减 去 $400.00 后 的 值 。 

S53Al1 .balance == $500.00, A2.balance == $500.00 
加 $400.00 到 账号 A2 后 的 值 。 


现在 让 我 们 看 另外 一 个 进程 P2， 它 与 进程 P1 同 时 运行 ， 对 这 一 存款 人 的 存款 和 额 进行 检查 ， 
如 时 他 的 所 有 存款 大 于 等 于 $900.00 那 么 允许 存款 人 取出 信用 卡 。 为 了 完成 这 一 任务 ， 进 程 P2 
必须 分 别 读 取 两 行 ， 它们 的 aia 值 分 别 为 A1 和 A2， 然 后 将 这 两 个 账号 虐 的 存款 值 相 加 。 当 进 
程 P2 在 状态 52 执 行 时 ， 存 款 总 烽 为 $600.00， 这 时 对 这 一 存款 人 信用 卡 的 检测 就 失败 ; 如 采 这 
两 个 账号 上 的 存款 总 额 为 $1000.00， 那 么 他 将 道 过 这 一 检查 。 这 里 我 们 给 出 了 一 个 操作 的 圭 
度 ， 它 将 导致 刚才 所 述 的 进程 P2 造 成 的 存款 总 额 视 图 : 


Ent BBall $u = 0 


pat 次 滞 EL ba 
where A.afd = Al" 
{现在 balance = O000 1 
select A.balonce intw :ba rom 贞 


here 上 .#1 = "Al 
suM = SUm + bal: 哎 在 wm- OD.DO } 


SE]ect .balance 1nto :bal from A 
四 eT 一 “中 盖 
Sum = $uMm 十 bel; ;现在 su = $600.00 ) 


{信用卡 被 拒 第 ) 


Update A set a 已 此 二 失忆 二 + F400 .00 
re 珊 - 本 jj 二 





现存 balance = S500.00 转账 完成 ) 
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但 是 进程 P2 在 状态 8S2 时 所 看 到 的 存款 余额 总 值 $600.00 实 际 上 是 一 个 假象 。 存 款 人 开始 时 
有 余额 $1000.00， 并 且 进 程 Pl 并 不 是 想 要 取 走 钱 ， 仪 仪 是 转账 而 已 。 在 状态 $2 下 显示 出 来 的 
存款 额 为 $600.00 的 情况 称 为 “不 一 臻 视图"。 我 们 假定 有 特定 的 必须 遵守 的 一 致 性 规则 { 如 
进程 P1 不 能 产生 或 者 消除 存款 ， 所 以 即使 执行 了 进程 1， 存 款 人 的 余额 总 值 不 应 该 改变 )， 然 
而 为 了 得 到 这 一 正确 的 最 后 状态 ， 在 进程 P1 的 逻辑 在 执行 过 程 中 必须 经 过 不 一 致 的 状态 ( 如 
状态 $2 )。 我 们 更 愿意 使 用 一 些 方法 ， 阻止 其 他 进程 看 到 这 些 暂时 的 不 一 致 状态 。 睹 

为 了 避免 访问 这 些 不 一 致 状态 和 由 于 并 发 访问 带 来 的 一 些 其 他 的 困难 ， 数 据 库 系 统 提供 了 
一 个 特征 ， 叫 懒 事 务 。 每 一 个 进程 可 以 将 一 系列 的 数据 库 操作 结合 到 一 起 ， 这 些 操 和 作 构成 了 一 
个 状态 的 一 致 性 改变 ( 如 进程 Pl 中 的 两 个 更 新 操作 ) 或 者 是 在 一 致 视图 下 的 一 些 尝 试 ( 如 进程 
P2 中 的 两 次 读 操作 ) ; 这 种 数据 库 拱 作 包 称 为 事务 。 注 意 ， 许 多 事务 要 求 更 新 必须 是 在 数据 处 
于 一 致 性 状态 的 基础 上 进行 ; 例如 ， 进 程 PI 的 两 次 更 新 操作 ,每 一 个 都 可 以 认为 是 在 读 操作 之 
后 进行 了 窟 操作 ， 并 且 这 两 次 读 必须 是 一 致 的 ， 理 则 在 最 后 的 余额 数量 上 就 会 出 现 错误 。 在 后 
面 我 们 将 进一步 讨论 这 一 点 。( 然而 ， 必 须 注意 到 虽然 每 一 次 更 新 都 可 以 被 认为 是 读 了 之 后 再 
写 ， 在 DBMS 中 占用 于 一 行 上 的 Update 语 名 本 身 是 不 可 分 的 。 任 何 操作 都 不 可 能 干预 这 一 更 新 
操作 时 的 读 和 写 。 从 这 种 意义 上 说 ， 对 应 于 一 行 的 Update 语 名 已 经 是 事务 上 不 可 分 的 。) 

支持 事务 的 数据 库 系统 给 程序 员 提 供 一 些 事务 特性 的 保证 以 方便 他 们 编写 程序 。 对 于 目 
前 的 讨论 ， 最 重要 的 一 个 保证 是 责 离 。 陋 离 保 证 了 即使 事务 TI ( 可 能 是 进程 P1 黄 个 更 新 操作 
的 包 ) 与 事务 T2 (可 能 是 进程 P2 两 个 读 操作 的 包 ) 同时 执行 ， 对 于 每 个 事 和 劳 而 音 ， 都 好 像 是 
不 受 对 方 事务 的 影响 而 与 其 他 事务 相互 隔离 地 运行 在 数据 库 上 。 当 我 们 说 隔离 时 ， 指 的 是 看 
上 去 要 么 是 1 了 2 在 Tl 开始 对 数据 作 改 动 前 运行 ， 要么 是 T2 在 T1 完 成 了 所 有 操作 之 后 执行 ， 事务 
T2 看 到 的 是 例 5.4.1 的 状态 S1 或 状态 S3， 不 会 看 到 $2， 因 而 不 可 能 导致 不 一 致 的 视图 。 

2. 如 何在 程序 中 指定 事务 

成 功 连接 到 一 个 数据 库 之 后 ， 在 进程 中 并 没有 活动 的 事务 。 没 有 活动 上 种 务 的 程 疗 可 以 通 
过 执行 任何 对 数据 库 行 进行 操作 的 SQL 语 名 (如 Select，Open Cursor，Update，Lnsert 或 者 
Delete ) 来 产生 一 个 活动 的 事务 。 在 运行 这 些 可 执行 语句 的 过 程 中 ， 宴 务 保持 活动 状态 ， 直 到 
程序 通过 执行 如 下 两 个 敌人 式 SQL 语 句 之 一 来 终 赴 事务 : 

“EXEC SQL COMMIT [WORK]; 这 一 语句 导致 事务 成 功 终止 ; 所 有 在 事务 中 被 更 新 

的 行将 永久 地 保留 在 数据 库 中 ， 并 且 这 些 行 对 其 他 并 发 用 户 来 说 六 成 为 可 见 和 的。 事务 中 

读 到 的 所 有 行 可 重新 被 其 他 并 发 用 户 更 新 。 

* EXEC SQL ROLLBACK [WORK]; 这 一 请 句 导致 事务 失败 终止 ;所 有 在 事务 中 对 行 

所 作 的 更 新 被 撤销 ， 恢 复 这 些 行 原来 的 值 ， 并 且 这 些 行 对 其 他 并 发 用 户 来 说 又 成 为 可 见 

和 的。 事务 中 读 到 的 所 有 行 可 重新 被 其 他 并 发 用 户 更 新 。 

虽然 关键 字 WORK 从 SQL-9%2 开 始 是 可 选 的 ， 但 在 SQL-89 中 它 是 必需 的 ， 因 此 为 了 对 较 老 
的 数据 库 系统 的 可 移植 人 性， 最 好 使 用 这 一 关键 字 。 在 事务 以 Comimit 或 Rollhack 结 束 之 后 ， 下 
一 条 操作 在 数据 库 行 上 的 SQL 语 句 开 始 一 个 新 的 事务 ， 这 一 事务 将 保持 活动 状态 直到 下 一 条 
Comtnit 或 Rollhack 语 合 。 

如 果 在 程序 结 东 前 对 于 一 个 事务 既 疫 有 执行 Commit 也 没有 执行 Rollback 语 句 ， 那 么 将 热 
行 -个 扒 省 的 动作 ， 这 一 动作 (Commit 或 Rollback ) 与 产品 有 关 。 在 这 一 章 开 头 的 例 5.1.1 和 
5.] .2 中 ， 我 们 看 到 了 这 两 个 例子 中 使 用 的 Commit 语 句 将 在 事务 中 读 到 的 行 所 加 的 锁 释 放 掉 。 
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这 些 锁 用 来 怪 证 事务 的 盎 离 ， 我 们 一 会 苑 束 讨 论 这 一 点 。 一 个 事务 通 尝 由 一 个 在 两 条 Commit 
语句 之 岂 的 数据 库 哥 作 集 (Select 语句 或 Update 谨 和 何 ， 或 两 者 都 有 ) 所 构成 ，Roillback 语 句 较 
为 少见 。 应 用 程序 的 一 个 典型 司法 是 ， 每 个 并 发 用 户 进程 在 大 量 语 人 名 之 间 循 十， 交替 地 去 求 
用 户 输入 ， 然 后 按照 用 户 的 意图 执行 一 组 数据 库 操 作 。 我 们 将 看 到 ， 在 跨越 用 户 的 交互 行为 
时 仍 保 持 事 务 的 活动 性 并 不 是 一 个 好 主意 ， 所 以 通常 在 要 求 用 户 输入 之 前 执行 Commit 计 人 句 。 
然而 ， 有 可 能 等 一 次 用 户 交 下 有 多 十 一 个 的 事务 ， 因 此 将 事务 从 .个 用 户 输入 持续 到 下 一 个 
用 户 输入 是 不 安全 的 做 法 ， 尽管 这 是 最 典型 的 做 法 。 

很 明显 向 系统 给 出 事务 的 结束 是 程序 员 的 克 任 一 一 系统 自己 不 能 吉 猜 出 来 。 一 个 涉及 到 
数据 库 更 新 ( 包括 Insert 和 Delete ) 的 事务 是 一 个 更 新 的 集合 ， 这 些 更 新 作为 一 个 整体 ， 要 人 么 
都 成 功 ， 要 各 都 失败 。 合 5.4.1 的 情况 可 以 扩展 为 在 许多 存款 账 导 之 间 转 账 ， 最 后 账 闻 了 ， 余 
额 既 不 能 多 也 不 能 少 。 和 由 是 系统 并 不 知道 什么 时 候 达 到 了 这 种 平衡 ( 它 并 不 遵 牢 数学 规则 )， 
除非 程序 员 在 提交 语句 中 说 明了 这 一 点 。 在 Commit 之 后 ， 所 有 在 事务 中 对 行 所 作 的 更 新 将 永 
久保 存 下 来 ， 并 且 这 些 行 对 其 他 并 发 用 户 成 为 可 见 的 。 在 Rollback 之 后 ， 所 有 在 事务 中 对 行 
所 作 的 更 新 被 撤销 ， 这 些 行 原来 的 值 成 为 可 见 的 。 必 须 保 证 只 涉及 到 数 杨 库 读 操作 的 事务 T2 
不 能 看 到 在 事务 T1 的 一 系列 更 新 操作 过 程 中 暂时 的 不 一 致 的 数据 库 状态 一 一 这 一 问题 在 倒 
5.4.1 中 可 能 发 生 ， 因 为 事务 T2 (代表 进程 P2 ) 在 事务 T1 (代表 进程 P1 ) 更 新 之 前 读 了 一 些 账 
号 的 值 ， 而 在 事务 T1 更 新 之 后 又 读 了 另外 一 些 账号 的 值 。 一 个 只 读 的 事务 T2 必 须 冻 结 它 所 接 
甬 的 所 有 数据 ， 这 构成 了 对 数据 库 进 行 更 新 的 事务 的 一 个 约束 。 因 此 ， 当 我 们 完成 任务 时 需 
要 结束 这 一 只 读 和 事务 ， 同 样 这 里 系统 还 是 不 能 猜 出 来 什么 时 候 应 该 终止 这 一 事务 。 程 序 员 需 
要 使 用 Rollback 或 Commit 指 明 一 个 事务 的 结束 。 在 只 读 事务 的 情况 下 ，Rollback 和 Commit 的 
效果 是 没有 分 别 的 ， 因 为 没有 对 数据 库 做 更 新 。 

对 于 一 个 程序 员 要 书写 更 新 事务 Roliback 语 名 是 极其 方便 的 ， 考 虚 上 一 - 段 中 在 许多 在 
款 账 户 之 间 转 账 的 钢 子 。 假 设 从 前 面 N - 1 个 账号 中 提 款 ， 然 后 这 些 提 款 的 总 铬 被 加 到 最 后 
的 账号 中 。 完 成 这 一 功能 最 简单 的 编程 方法 是 读 取 每 一 条 新 的 账号 行 ， 检 查 这 一 余 镶 是 否 
能 够 满足 所 要 提取 的 钱 款 数 目 ， 假设 答案 是 肯定 的 ， 那么 从 这 行 的 余 葡 中 减 去 这 一 提 款 数 
目 ， 然 后 继续 处 理 下 一 行 ， 得 到 了 所 有 前 面 提 款 数 目的 总 和 之 后 更 新 最 后 - - 行 ， 然 后 提交 。 
其 他 的 事务 不 能 够 看 到 这 些 中 间 的 更 新 过 程 ， 直 到 这 一 和 新 事务 提交 了 ， 所 以 不 存 存 当 我 
们 还 未 确定 事务 是 否 成 功 时 其 他 用 户 看 到 所 和 作 更 新 的 危险 性 。 但 是 现在 假设 在 这 一 系列 园 
新 中 磁 到 某 一 账号 的 余额 没有 足够 的 资金 ， 那 么 我 们 就 不 能 完成 这 一 事务 。 程 序 只 要 简单 
的 执行 Rollhack 语 句 就 可 以 了 ， 而 不 是 往 回 读 已 经 被 更 新 过 的 每 行 ， 恢 复原 来 的 值 〈 在 这 
样 做 的 过 程 中 很 有 可 能 发 生 错 误 )。 回 退 ( Rollback ) 的 一 个 善 裔 应 用 的 同义词 是 事务 的 异 
常 中 止 (abort )。 执 行 了 Rollback 之 后 ， 到 上 自前 为 由 所 作 的 所 有 更 新 都 被 系统 自动 撤回 了 ， 
就 好 像 事 务 中 的 更 新 从 来 就 没有 发 生 过 一 样 。 

数据 库 系统 能 够 回 退 失败 事务 中 所 有 更 新 操作 的 功能 显示 了 系统 所 提供 的 另 一 个 保证 
( 就 像 隔 离 )， 这 一 保证 被 称 为 原子 性 。 原 子 性 给 程序 员 提 供 了 这 样 的 保证 ， 在 -个 事务 中 所 
执行 的 行 的 更 新 操作 集 是 一 个 “原子 ”"， 即 它 是 不 可 分 割 的 ; 雪 么 所 有 的 更 新 操作 都 发 生 ， 要 
么 都 不 发 生 。 为 了 支持 原子 性 ， 必 须知 道 当 事务 异常 中 止 时 应 该 撒 回 数据 库 中 所 更 新 的 行 ， 
数据 库 系统 应 该 有 某 种 方法 记录 这 些 行 的 更 新 ， 并 且 把 这 些 记 东 椰 起 来 以 备 后 用 。 这 种 “要 
么 全 有 要 人 么 全 无 ”的 更 新 保证 甚至 在 系统 贿 泪 时 仍然 成 立 ， 系 统 出 省 时 内 存 竺 失 并 且 不 可 能 
记 住 程序 在 做 什么 、 已 经 做 了 什么 更 新 或 者 为 什么 做 了 这 些 更 新 。 
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成 功 提交 的 事务 对 数据 库 所 作 修 改 在 因 系 统 角 性 时 仍 能 僚 复 原状 的 性 质 叫 做 持久 性 ， 这 
是 数据 库 系 统 提供 给 程序 员 的 第 三 个 保证 ， 另 外 的 两 个 保证 是 前 面 所 述 的 隅 离 性 和 原子 性 。 
为 了 支持 持久 性， 数据 库 系统 必须 作 额 外 的 记录 来 提醒 它 自己 的 意图 并 且 保 证 它们 被 存放 到 
了 磁盘 上 ， 以 使 得 它 能 从 内 存 丢 失 中 依 复 过 来 。 我 们 注意 到 关于 事务 的 一 些 保 证 有 些 隐 合 的 
东西 ， 伺 是 在 这 里 不 讨论 许多 较为 复杂 的 内 容 ， 我 们 在 后 面 章节 中 介绍 了 更 新 事务 之 后 青 来 
讨论 这 些 问 题 。 在 本 节 中 ， 我 们 讨论 更 新 时 只 停留 在 能 把 读 操作 时 的 一 性 性 视图 讨论 清楚 的 
深度 上 ; 在 这 一 节 中 的 剩余 部 分 我 们 将 着 重 寺 只 读 事务 和 隔离 保证 。 

3. 事务 的 例子 

图 5-13 举 了 一 个 银行 出 纳 员 要 求 在 账号 之 间 转 账 的 银行 事务 程序 的 例子 。 回 忆 一 下 一 个 
事务 是 以 第 一 条 对 数据 库 行进 行 操作 的 SQL 语句 开始 的 ， 所 以 前 面 的 声明 部 分 、Conneect 语 何 
和 在 图 $-13 中 的 程序 中 包含 提示 的 循环 都 不 是 任何 事务 的 一 部 分 。 对 用 户 的 提示 要 求 用 户 输 
人 拷 定 帐号， 分 别 命 名 为 from 和 to， 它们 指明 了 转账 所 涉及 的 两 个 账 叶 以 及 转账 的 金 秽 。 
sscanf() 昭 数 用 来 将 金额 的 立 本 格式 (存放 在 数组 dol1larstr[] 中) 转换 成 金额 的 
double(float) 格 式 《 存放 在 变量 dollars 中 )。 要 理解 这 一 部 分 代码 ， 你 应 该 阅读 附录 B.1。 其 中 ， 
设置 事务 语句 SET TRANSACTION ISOLATION LEVEL SERIALIZABLE 古 一 个 样板 庄 句 ， 你 
现在 没有 必要 理解 ， 我 们 将 在 10.5 节 中 进一步 讨论 事务 时 解释 它们 。 

操作 在 数据 库 行 上 的 事务 语句 是 两 条 Update 语 句 ,， 如 果 执 行 这 些 语 名 没有 返回 错误 ， 事 
务 就 被 提交 ， 程 序 结 束 。 和 如果 有 和 错误， 控制 会 跳 转 到 do_rollback， 并 且 事 务 回 退 。 在 这 种 情 
况 下 ， 如 果 第 一 条 更 新 已 经 发 生 了 ， 数 据 库 系 统 将 撤回 所 有 的 改动 ， 将 数据 库 恢 复 到 这 一 事 
务 从 未 运行 时 的 状态 。 

一 般 而 言 ， 这 种 程序 会 在 一 个 泪 数 调用 中 执行 ， 在 程序 前 面 的 往 环 中 让 出 纳 员 选 择 所 要 做 
的 操作 ， 如 从 一 个 账号 到 另 一 账号 转账 金额 、 从 一 个 账号 提 款 、 存 钱 到 一 个 账号 、 查 询 账号 作 
额 ， 等 等 。 在 图 5-13 中 ， 程 序 执行 事务 的 部 分 被 放 在 一 个 竹 环 中 进行 重复 ， 并 且 强 调 了 在 每 个 
转账 过 程 的 最 后 使 用 Commit 或 Rollback 请 句 的 重要 性 ; 否则 当 另 外 一 个 不 同 客 户 的 事务 开始 
时 ， 旧 的 事务 将 仍然 有 效 ， 并 且 最 后 会 导致 所 有 的 账号 行 被 其 他 的 出 纳 员 锁 住 而 不 能 使 用 。 

注意 到 可 以 同时 在 同一 个 程序 中 运行 不 同 的 进程 (代表 不 同 的 出 纳 员 )， 并 且 一 个 进程 下 
的 事务 可 能 是 将 存款 从 账号 A1 转 移 到 账号 A2， 然 而 另 一 事务 将 存款 从 账号 A2 转 称 到 账号 Ai。 
令 人 惊 订 的 是 ， 如 果 在 这 一 程序 中 的 事务 中 都 设 有 包含 一 对 Update 语 句 ， 那 么 这 些 事 劳 并 不 
会 相互 影响 ， 即使 Update 语 句 是 交织 的 ， 同 样 的 转账 依然 可 以 成 功 完成 。 这 是 因为 对 单个 行 
单独 执行 的 各 个 的 Update 语 句 是 不 可 分 的 ,不管 目前 的 账号 余额 为 和 多少， 都 完成 要 求 的 任务 ， 
加 或 减 去 一 个 美元 数额 。 但 是 对 于 包含 两 条 Update 语 句 的 事务 ， 就 不 能 成 功 完成 如 图 5-13 的 
转账 ， 而 需要 一 个 事务 保证 与 它 并 发 的 事务 能 从 两 个 账号 中 返回 正确 的 余额 总 值 。 

注意 到 在 图 5-13 的 程序 中 ， 用 户 交 互 (prompt(0) 循 环 ) 是 完全 在 任 一 事务 的 作用 域 之 外 执 
行 的 。 这 是 因为 这 样 做 可 以 使 得 事务 能 够 较 快 地 被 执行 ， 以 使 为 保证 隔离 而 被 这 一 事务 卢 用 
的 锁 或 其 他 资源 不 会 对 其 他 事务 有 长 期 的 负面 影响 。 这 将 在 后 面 进一步 讨论 ， 

4. 事务 及 高 的 保证 和 加 锁 

隔离 属性 保 证 了 当 事 务 Tl1 和 T2 同 时 执行 时 ， 对 于 每 个 事务 而 宜 它 对 数据 库 的 操作 不 受 男 
外 一 个 事务 的 影响 。 更 准确 地 说 ，T2 所 作 的 所 有 数据 库 操作 看 上 去 要 么 都 是 在 TI 开始 之 前 要 
么 就 是 在 TI 完成 之 后 。 另 外 一 种 说 法 是 任 一 并 发 执行 的 事务 集 台 ， 它 的 执行 结果 就 好 像 这 些 事 
务 是 按照 某 种 串 行 的 顺序 来 执行 的 ， 即 对 于 这 一 集合 中 的 任意 两 个 事务 ， 它 们 中 的 一 个 必须 在 
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男 一 个 事务 开始 之 前 完成 它 所 有 的 操作 。 事务 好 像 是 按照 某 种 串 行 的 顺序 执行 的 这 一 事务 特性 、 
也 称 为 可 串 行 性 ， 我 们 将 在 下 一 章 深 和 讨论 这 -一 人 性质。 在 这 里 可 串 行 性 与 隔离 是 等 价 的 。 


#include 《stdio,h> ， 
#include "prompt.h”" 
int maint ) i* note no #incliude SOLCA, since SOL-99 deprecates this 
{ 
exec 591 begin decTare section: 
char acctfrom[1l1], acctto[ll]: 
double dollars: 
exect Sql] end deciare section: 
char dol larstr[L2?d1. 


exeC Sl Connect to default; i* {not part of transactiocon} 
exec sgl set transaction isolation level serializable; 
white tl} { A* oo0p forever: simplified teller-program loo0p 
«while tipromptt"Enter froem,. to accounts and dollars for transfer:\r"™, 
3, acctfrom, iO, acctto, 10, dollarstr, 107} < 0} [| 
sscanftdollarstr, "%1f" ,dellarsy t= 17} 4 it CONVert te double 
printfe“Invalid input, input example: 345633 445623 100.45n™"Y: 
} i Above, Print out error msg Until input is acceptable 
exet S91 whenever saqlerror goto do_rollback: 


in transaction starts here-- 
exec sql Update accounts set balance = balance - :do11ars 


where aect = :acctfrom: 


exet sql update accounts set balance = balance + :dollars 


where actt = :acctto; 
axee Sql commit work: i transactiogn ends here... 
printfi"Transfer complete\n™}: 
continue: 
do_roilback: 

XEC sql rollback works: 1 
printft"Transfer failed\n”}: 

} 

EXee S01 disconnect current; 

return 9: 





图 5-13 在 账号 之 问 转账 的 简单 程序 (SQL-99) 


如 果 我 们 将 T1 看 做 是 一 个 同一 个 更 新 事务 集 并 发 执行 的 只 该 事务 ， 它 最 后 一 段 的 定义 意 
味 着 在 这 些 并 发 执行 的 更 新 事务 的 某 些 ( 可 能 为 0) 已 经 完成 之 后 事务 T1 只 看 到 数据 库 的 一 致 性 
状态 。 数 据 库 系统 实现 隔离 最 普遍 使 用 的 方法 是 对 数据 库 行 加 锁 。 简 化 了 的 吉 锁 规则 在 图 5- 
14 中 给 出 ， 这 些 规则 有 助 于 支持 事务 的 隔离 。 

更 加 普遍 的 如 锁 方 法 将 会 在 第 10 章 中 介绍 ， 这 种 方法 对 读 访 问 的 锁 (R 锁 ) 和 更 新 (或 
者 说 是 写 ) 访 冶 锁 (W 锁 ) 区 别 对 待 ; 但 是 现在 我 们 只 讲 在 扬 有 情况 下 使 用 的 简化 了 的 排他 锁 
的 方法 。 


上 一 hm 
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1) 当 事 务 访问 R 行 时 ， 它 必须 以 排 它 模式 先 对 该 行 加 镇 。 
2) 直到 事务 结束 (提交 或 撤回 ) 才 将 事务 中 得 到 的 所 有 的 锁 释 放 。 
3) 如 果 TI 已 加 锁 了 一 行 R 并 且 另 一 个 事务 T2 企图 访问 该 行 ， 那 么 在 访问 它 并 被 拒绝 之 前 T2 


也 企图 锁定 只 ， 内 此 T2 的 锁 与 Ti 保 圭 的 锁 冲 窒 。 
4) 对 于 系统 而 言 解决 这 -冲突 通常 采用 的 方法 是 等 到 TI 所 父 或 异常 中 上 正 并 释放 了 对 民 的 锁 之 
后 ，T2 的 加 锁 要 求 才 能 被 满足 ，T2 继续 执行 。 





图 5-14 简化 的 保证 隔离 的 数据 库 行 加 锁 规 则 


例 5.4.2 ”加 锁 和 不 一 致 视图 ”考虑 图 5-15 中 事件 的 顺序， 这 是 例 5.4,1 的 重 述 ， 开 始 时 账 
号 A1 有 balance $900.00，A2 有 $100.00: 


事务 T1 更 新 事务 事 和 状 T2 只 读 事 务 


int bal, sum = .00; 


Update A set balance ~ balance - $400.00 
where ,aid = ‘Al: 
(现在 balance = $500.00) 
select A.balance into :bal from nA 
where A.aid = Al': 
sum = sum + bal; ( 瑞 在 5. = $00.00 1 


st1lect A.balance inte :bal from ns 
Where A =- AP': 
sum = sum + Peal: (HWM Sum = $0O0.00 ) 


Update A set balance 一 balance + $400.00 
Where 二 ,aid = "A2": 
| 现在 balance = $500.00 } 


commit work: 


commit work: 





图 5-13$ 没有 加 锁 的 事务: 不 一 至 数据 视图 


例 5.4.1 的 事件 顺序 允许 进程 P2 得 到 有 关 账 号 a1 和 A2 的 balance 的 不 … 致 视图 ， 这 一 事 
件 序 列 与 例 5.4.1 相 对 应 。 在 这 一 调度 中 ,事务 T1 代 表 进 程 P1， 些 务 T2 代 表 进程 P2; 图 中 行 的 
次 序 就 是 访问 的 次 序 ， 所 以 这 两 个 事务 的 访问 是 交织 在 一 起 的 。 开始 时 ， 账 号 al1 (A.aiq 
-1A1l' 的 balance 为 $900.00，A2 的 balance 为 $100.00。 

在 图 5-15 中 ， 事 务 T2 看 到 了 A1 和 A2 两 行 的 不 一 臻 视图， 这 一 视图 与 例 5.4.1 中 的 状态 $2 有 
美 联 。 但 是 现在 我 们 考虑 如 和 何 使 用 前 面 所 述 的 方法 对 这 些 行 加 锁 。 在 图 5-16 中 ， 可 以 看 到 T1 
在 更 新 行 &1 之 前 必须 先 对 其 加 锁 。 此 后 .事务 T2 在 通过 Select 语 句 读 取 行 A&1 时 想 要 对 它 加 锁 ， 
这 一 加 锁 将 不 被 准许 ， 它 必须 等 到 事务 T1 完 成 了 它 的 操作 并 县 提 变 了 之 后 才能 对 a1 加 锁 。 这 
将 使 事务 T2 的 所 有 操作 都 被 延迟 ， 直 到 T1 的 两 个 更 新 操作 都 完成 ， 这 时 T2 能 够 执行 它 的 读 操 
作 并 看 到 一 致 性 状态 S3。 图 5-16 给 出 了 这 些 事件 的 顺序 。 

自然 ， 这 仅仅 是 一 个 例子 ， 并 不 能 证 明 在 所 有 情况 下 都 可 以 通过 行 加 俩 来 确 你 疝 离 性 。 
实际 上 要 获得 这 一 保证 有 一 些 其 他 的 细节 要 谈论 特别 是 当 使 用 Gpen Cursor 语 全 得 到 一 个 活 
动 的 行 集合 时 },， 但 是 行 加 锁 是 大 多 数 数据 库 系统 用 以 保证 隔离 的 基本 方法 。 以 后 我 们 假设 这 
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些 加 锁 的 动作 在 所 有 的 数据 访问 中 都 发 生 。 国 


事务 TI1( 更 新 事务 ) 事务 T2( 只 该 事务 ) 
EE TT 


Update A set balance = balance ~ 4.00 
Where A.aid = Al': 
(这 一 行规 在 被 色 定 balance = $300.00 ) 


select A.balance into :bal from & 
Where 下 .ai = Al": 


{ 相 同 的 行 被 下 锁 征 ， 必 须 等 待 ) 

































| 
事务 〔 或 更 多 ) 等 待 其 他 事务 释放 资源 并 且 如 果 没 有 一 个 事务 放弃 (rollback 或 abort ) 资源 使 
而 aA2 已 被 T2 锁 住 了 上 了， 所 以 T1 加 锁 失 败 。 系 统 让 T1 等 待 直到 T2 提 交 并 释放 它 所 拥有 的 锁 ， 但 在 


Update A set balance = balance + $400.,00 
where A.aid ~ "A2"; tThis row now locked} 
{ 现 在 balance=$500.00 ; 转 几 完成 
select A.balance into :bal from n 
Where A = "Al': 
sum = sum + bal: (了 现在 sum=$500.00) 
setect A,balance into :bal from A 
Where A=— "he": 
sum = sum + bal; (了 匠 在 sum = $1000.00 ) 
图 5-16 对 事务 加 锁 改 正 了 图 5-15 中 的 不 一 敏 视 图 

5. 事务 中 需 特别 考虑 的 事项 

在 保证 隔离 时 存在 一 个 问题 ， 当 两 个 事务 的 访问 导致 了 死 锁 怎么 办 ? 我 们 也 将 在 下 文 介 
绍 为 什么 通常 情况 于 有 必要 在 事务 中 避免 用 户 交 互 。 

(1) 死 锁 

位 随 用 数据 库 行 加 锁 来 保证 隔离 所 带 来 的 一 个 潜在 的 问题 是 有 可 能 会 出 现 死 锁 。 当 两 个 
得 没有 事务 可 以 进行 ， 那 么 将 导致 死 锁 。 

例 5.4.3 事务 死 锁 ”让 我 们 重 述 一 下 例 5.4.2， 但 是 这 里 事务 T2 的 访问 数据 顺序 有 所 不 同 ， 
见 图 $-17 的 调度 表 。 

在 这 个 例子 中 ， 事 务 TI 在 更 新 行 A1 之 前 先 锁 住 了 它 。 然 后 事务 T2 在 用 Select 语 句 读 取 行 
A2 之 前 成 功 对 A2 加 锁 。 但 是 现在 事务 T2 想 要 对 行 A1 加 锁 ， 而 A1 已 被 T1 锁 住 了 ， 所 以 T2 加 锁 
失败 。 系 统 让 T2 等 待 直到 Ti 提交 并 释放 它 所 拥有 的 锁 。 接 于 来 ， 事务 T1 想 要 对 记录 &A2 加 锁 ， 
这 种 情况 下 系统 需要 能 够 识别 出 这 一 死 锁 状 态 。TI 不 能 继续 执行 直到 T2 提 交 并 释放 了 锁 ， 但 
是 由 于 T2 又 在 等 待 T1 完 成 并 释放 锁 ， 所 以 T1 将 永远 不 能 继续 下 去 。 两 个 事务 直到 为 外 一 个 释 
放 了 它 所 拥有 的 锁 才 能 继续 执行 。 在 这 种 情况 下 ， 如 果 系 统 不 想 让 这 些 事务 永 撑 挂 在 那里 ， 
它 就 要 让 其 中 的 一 个 能 够 继续 下 去 。 伐 法 是 从 这 两 个 事务 中 选择 一 个 回 退 。 这 被 称 为 死 锁 中 
止 。 所 有 由 最 后 被 中 目的 事务 所 做 的 更 新 被 取消 ， 运 行 这 一 事务 的 进程 收 到 一 条 由 最 近 的 数 
据 访问 语句 所 返回 的 出 错 人 信息， 进程 的 混 辑 由 这 一 点 继续 。 运 行 这 一 被 中 目 事 务 的 进程 可 以 
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米 取 的 方法 是 重新 运行 事务 《 即 试图 重新 执行 这 一 事务 }。 注 意 到 对 被 中 止 的 事务 不 仅 所 有 的 
行 里 新 被 取消 ， 在 其 中 读 取 的 所 有 行 值 也 被 认为 是 不 可 信和 的 【它们 当中 的 一 些 可 能 在 锁 释 放 
后 被 另外 一 个 更 新 事务 改变 )， 所 以 唯一 安全 的 方法 是 重新 执行 这 一 事务 。 


EE 
0 


Update & set balance = balance - $4#00.,00 
Where A = Al': 


[得 到 锁 


select .balance into :bal 了 from 遇 
Where = "A2'} 
sum = sum + bal; (得 到 稍 ) 


select A.balance into ;bal from 内 
where A= pl'; 


Update A set balance = balance + $400.00 
where A 一 “下 之 " 


( 同 T2 溃 突 ， 等 待 ) 





图 5-17 事务 的 死 锁 加 


对于 骨 人 式 SQL 的 应 用 程序 编程 ， 死 锁 中 止 条 件 隐藏 着 重要 的 含义 。 如 果 系 统 异 常 中 止 
完成 了 一 部 分 运 辑 的 事务 来 解除 死 锁 ,程序 就 需要 检测 出 这 一 状态 并 旭 尝 试 重新 执行 这 一 事 
务 ， 即 重 试 。 重 试 的 方法 在 例 $.4.3 中 提 到 ， 但 实际 上 通常 应 由 程序 逻辑 来 实现 ， 并 且 可 能 会 
有 许多 复 森 性 。 尝 试 重 试 是 正确 的 司法 ， 因 为 前 面 事务 执行 中 产生 的 失败 并 不 是 妈 辑 上 的 间 
题 ， 而 仅仅 是 在 时 间 调 度 上 的 问题 ， 所 以 我 们 有 埋 由 希望 再 执行 一 让 串 务 将 成 功 完成 。 


在 开始 了 一 个 事务 之 后 ,程序 必 须 从 访问 数据 的 SQL 语句 返回 的 sqlca .sqlcode 中 寻找 
“deadlock abort” 的 出 错 信 息 。ORACLE 和 DB2 UDB 产 品 对 于 这 一 状态 的 sqlca ,sqglcoae 错 
误 编 码 显示 在 图 5-18 中 。 我 们 也 给 出 了 ORACLE 在 ANSI 模 式 下 支持 的 SQLSTATE 的 错误 返回 
信息 。 

变量 值 描述 


ORACLE sqlca.sqlcode 





DBz UDR sqlca. sgqltode -911 


图 5-18 死 锁 中 止 错误 (ANSI 模 式 下 的 ORACLE 和 DB2 UDB 也 支持 SOLSTATE) 


死 锁 中 止 的 错误 返回 几乎 会 出 现在 一 条 对 数据 库 中 数据 进行 读 或 更 新 的 语句 的 任何 时 候 。 
对 于 一 个 死 锁 中 止 ， 程 序 应 该 反复 瞧 试 多 次 运行 事务 ( 即 重 试 事务 ) 如 果 死 镇 继续 出 现 ， 于 
么 可 能 潜藏 着 蝎 严 重 的 问题 ， 程 序 应 当 建议 用 户 请 教 系统 管理 员 (终端 用 户 通常 缺少 对 事务 
细节 的 理解 )。 注 意 到 如 果 你 在 检测 出 死 锁 中 止 的 语句 之 前 建立 了 一 个 条 件 句 处 理 程 序 ， 如 
whenever sqlerror stop， 那 么 这 一 死 锁 中 止 的 错误 将 不 会 被 检测 到 。 就 像 在 4.2 节 中 


rp 
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看 到 的 那样 。Whenever 语 名 在 对 一 错误 显 式 检测 之 前 已 对 错误 做 出 了 反应 ( 椒 幸 的 是 ， 没 有 
与 死 锁 中 止 相关 的 Whenever 条 件 )。 因 此 捕捉 死 锁 中 止 的 错误 之 前 在 适当 的 位 置 为 错误 返回 设 
置 缺 当 的 CONTINUE 动 作 是 非常 重要 的 。 


例 5.4.4 。 死 锁 中 止 检测 在 接 下 来 的 程序 航 中 我们 写 了 一 个 使 用 查找 更 新 语句 对 多 行 
进行 更 新 的 事务 ， 并 且 当 死 锁 发 生 时 重 试 事务 。 用 的 是 ORACLE 中 死 锁 中 止 错误 信息 返回 的 
符号 常量 这 一 编码 的 另 … 个 可 选 的 更 具 潜 在 移植 性 的 版 本 将 使 用 SQLSTATE 值 。 


#define DEADABORT -560 
#define TRUE 1 
exec 591 whenever sdqlerror continue: 
int count = 0: 
while {TRUE; 1{ /六 loop over deadliock-abort retries Wid 
exec 59] update customers 
set discnt = 1.1*discent Where city = New York"; 
if {sqlca.sgqlcode 一 DEADABORT] { 


count+t: i* count up deadlock aborts ws 
if tecount < 4) 1 i* retry up to four times + 
exec Sq] rollback work: 
i* here, call operating System to wait for a Second 二 
] else break: i* too many retries pf 
else 1f Sqlca.s5qlcode < 0) 
break: i non-deadiock error wf 
l 
if (solca.sglcode < DY 1 i* over-retried deadlock or other error *f 
print_dberror: }: i print errar MESsSoye 
BXEC S01 rollback work: 
return :1: i* return error tp 
} else Feturn 省 ; i return suetess 二 
注意 到 在 事务 运行 中 可 能 存在 其 他 错误 ， 例 如 在 申请 锁 时 超时 ， 但 在 死 锁 中 止 的 情况 下 
重 试 事务 看 来 是 最 合理 的 做 法 。 图 


重 试 事务 还 有 男 一 个 需要 海 虚 的 重要 事项 。 有 可 能 在 事务 死 锁 中 目 之 前 的 执行 过 程 中 程序 
重新 设置 了 内 存 中 的 一 些 局 部 程序 变量 。 这 些 局 部 变量 可 能 代表 被 订购 产品 的 标志 ， 例如， 
当 数 据 库 中 相应 的 产品 被 取出 时 ,标志 被 清除 ; 还 有 一 种 可 能 是 一 个 局 部 变量 代表 了 某 个 用 
户 所 订购 的 总 爹 额 。 在 死 镇 中 止 发 生 之 后 ， 所 有 的 数据 库 信息 被 问 退 到 程序 远 辑 第 一 次 看 到 
这 一 信息 时 的 那个 位 置 。 然 而 ， 内 存 中 的 局 部 程序 变量 是 不 受 数据 库 控制 的 ， 所 以 程序 员 应 
当 注 意 使 这 些 变量 也 要 返回 到 它 原 来 的 初始 值 。 如 果 原 来 的 状态 难以 恢复 ， 程 序 员 应 当 在 开 
始 事务 之 前 复制 所 有 的 在 事务 执行 过 程 中 可 能 改变 的 状态 变量 ， 当 死 锁 中 止 发 生 时 青 将 这 些 
原始 值 复制 回去 。 

(2) 事务 执行 期 间 不 进行 用 户 交 互 

数据 库 行 加 锁 最 重 权 的 特征 之 一 是 只 要 事务 保持 活动 状态 , 事务 就 一 直 占 有 它 所 获得 的 锁 ， 
也 就 是 说 ， 直 到 程序 执行 了 Comtmit 或 Rollhack 语 句 。 这 限制 了 事务 合适 的 持续 时 间 。 一 个 事务 
锁 住 了 一 行 之 后 ， 这 一 事务 执行 期 间 的 每 一 秒 都 阻止 了 想 要 访问 这 一 行 的 其 他 用 户 。 最 重要 的 
一 条 淮 则 是 当 事 寺 在 执行 时 不 应 发 起 任何 用 户 交 互 〔 当 重 要 的 数据 仍 不 能 被 访问 时 ， 用 户 可 能 
想 与 人 谈话 ， 或 者 溜 路 出 去 唱 杯 咖啡 )。 然 而 ， 在 许 儿 情况 下 程序 可 能 要 在 事务 执行 当中 与 用 
户 变 也 ， 
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例 5.4.5 事务 中 的 用 户 交互 ”考虑 图 5-19 的 程序 段 ， 我 们 从 代理 商 那 里 接受 订单 ， 更 新 
products 表 中 的 quantity 列 ，quantity 代 表 了 在 仓库 中 可 得 到 的 产品 数量 。 这 一 程序 局 
与 代理 商 变 互 ， 检 测 订 单 是 奏 被 填写 ， 并 且 它 不 能 防止 所 有 可 能 的 错误 。 


i Interaction with agent taking product order for pid given by reqg_pid wi 
exeC SN select price, quantity into :price, :doh 
from products where pid = :red._pid: f* get info for later use 二 
while (TRUE 1{ i oop Until we get a quantord that fits in goh */ 
printfi"HWe have %d units on hand at a price of %d each\n”, qoh,. price}): 
if tprompti"How many units?%n", 1, quantordstr, DUANTORDLEN}Y < 上 
(sscanftdyuantordstr, "Pd" , Bouantordy i= 17} fi* get jnt from string*r 
printft"Please enter a decimal number.\n™},; 
CONntinue: i start over pass in loonp 二 
上 
if {quantord <= qoh) 
break:; i* break out of loop if quantord fits in qoh 
else printtt™"There are not engugh units to fill your order, yn ii 
} A* end get-quantord 1o0p 
Exe S91 Update products i refiect new order 
set quantity = quantity 一 :quantord A now know this fits 
Where pid = :reg Pid: 
i now iNSert new order in orders tabte 


xec Sql Comit work; i transaction complete 





图 5-19 拙劣 安排 用 户 输入 位 置 的 程序 段 ( 例 5.4.5 的 图 解 ) 


广 意 到 当 While 循 环 中 多 用 户 交 万 发 生 时 ， 通 过 Select 请 人 可 已 经 执行 了 对 products 行 的 
读 操 和 作 ; 已 经 开始 了 一 个 事务 并 月 products 中 的 一 行 已 被 加 锁 。 当代 理 商 在 与 客户 就 所 需 
订单 其 进行 协商 的 过 程 中 ， 其 他 代理 商 不 能 订购 这 一 产品 。 在 行 被 锁 住 时 执行 用 户 交 互 不 是 
数据 库 系 统 的 运行 捧 错 误 一 -数据 库 系 统 并 不 知道 上 述 例 于 中 的 用 户 交 互 一 一 但 是 在 实现 时 ， 
如 果 程 序 中 锁 住 的 行 有 可 能 被 男 一 几 户 访问 ， 还 是 应 该 培 锡 用 尸 交 互 。 了 嘱 


当 事 务 不 在 用 户 交 互 之 间 跨 越 时 会 产生 一 个 令 人 吃惊 的 问题 。 


例 5.4.6 没有 封闭 事务 的 用 户 交互 ”考虑 图 $-20 的 程 订 眉 ， 它 是 图 5-19 的 重 写 ， 这 里 避免 
了 事务 执行 中 的 用 户 交 互 。 

它 看 上 去 像 是 对 例 5.4.5 逻 和 辑 的 一 个 直接 的 修改 ， 避 免 了 在 用 户 请 求 时 保留 锁 。 然 而 ， 邵 
果 我 们 仔细 地 看 一 下 就 会 注意 到 一 些 奇 怪 的 事情 发 生 。 检索 选中 产品 的 price 和 quantity 
之 后 ， 我 们 在 问 代 理 商 想 要 多 少数 量 的 订单 之 前 提交 了 这 一 事务 。 当 代理 商 啊 应 时 我 们 已 不 
再 对 这 - 行 加 锁 ， 人 得 是 有 可 能 在 第 一 次 污 取 它 到 根据 代理 商 的 回答 更 新 这 行 的 时 间 肉 有 另外 
的 事务 改变 了 这 行 中 的 quantity。 因 此 我 们 显示 给 代理 商 的 qoh 值 可 能 已 经 无 效 了 。 因 此 必 
琉 在 Update 语 句 本 身 中 检测 所 订购 的 产品 数量 (quantord )， 确 定 仪 当 减 去 quantor9d 后 不 
会 使 quantity 小 于 0 时 才 对 products .quantity 作 和 更新。 如 果 块 行 提 新 后 没有 行 被 影响 
到 (NOT FOUND 条 件 满 足 )， 那 么 由 于 所 要 求 的 数量 过 多 ， 这 一 订单 被 拒绝 。 令 人 惊讶 的 是 ， 
即 全 要求 订 购 的 数量 比 我 们 之 前 显示 出 来 的 手头 上 拥有 的 产品 数量 少 ， 这 一 订单 也 可 能 被 拒 
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第 。 例如， 我 们 可 能 已 经 显示 出 来 目前 的 产品 数量 有 500、 然 而 却 拒 绝 了 -个 要 求 订购 数量 为 
400 的 订单 ， 并 告诉 用 户 “ 对 不 起 ， 目 前 没有 足够 的 数量 满足 你 的 订单 。” 更 糟 的 是 ， 如 果 我 
们 再 执行 一 由 克 hilie 循 环 ， 将 新 的 quantity 值 读 到 gcoh 中 ， 显 示 这 一 值 ， 告知 目前 有 300 个 
产品 ， 然 而 条 现在 客户 要 求 订购 数量 为 300 的 产品 ， 我 们 可 能 会 多 一 次 拒绝 这 --- 订 单 1 


1* lnteraction with agent for product regqg_pid-Yersion 2 
while 《TRUE) 1 A a0p Until update SUCceeds 
xee S91 select price, guantity into :price, :040h 
from products where pid = :req_pid: Air get info for lateér use 
i# shouldn't hold tock durinmg user interaction, $s0 need to tommit 
XeE SH COMMmIt nork:; 
printft"We have %d units on hand at a price of %d each\n™", qoh, pricey; 
if {prompt{"How many uNnits?hn", 1, quantordstr, OUANTORDLENY < 0) || 
(sscanftquantordstr, "Yd" ,gquantord) l= 1)} ret int from string 
printft"Please enter a decimal number\n™); 
continue: zs start over pass Tin loop 
1 
已 其 BC S59 wherever net found geto unitsgone; 
exEc 591 update products i* New type of update with... 
set quantity = Quantity - :quantord 
where pid = :re Pig 
ard quantity - :qauantord >= 0; A NEW test that guantord fits*/ 
fw insert new order in orders table 
ExXBC S01 commit work; A* transaction complete 上 
break; A* break aout of Toop «yf 
Unitsgone: As* Ff no row selected, guantord didn"t fit yf 
printft"There are not enough units to fil] your Order, An 
xec 59l rollback work: A* unneeded: ne lock held -yp 


} i* try-update lo0p wi 





图 5-20 程序 段 ( 例 5.4.6 的 图 和 解 ) 
国 


这 -一 类 不 … 钱 性 是 很 少见 的 ， 这 是 在 写 事 务 系 统 时 我 们 道 常 需要 接受 的 一 各 情况。 你 可 
能 在 预订 航班 库 位 的 时 人 息 过 到 过 类 似 的 情况 ， 机票 代 理 并 始 时 说 :“ 有 一 个 靠 窗 的 位 子 ; 我 会 
为 你 预订 它 ”"， 过 - -会 儿 之 后 区 说 :“ 嗅 ， 对不起， 别人 已 经 预订 了 1! 

(3) 游标 和 事务 

正常 情况 下 用 Commit 或 Rollback 语 名 结束 一 个 事 荔 时 ， 所 有 打开 的 详 标 被 关闭 。 这 一 缺 省 的 动 
作 反 负 了 编程 的 一 种 普通 模式 ， 在 这 一 模式 下 ， 孵 标 在 一 个 作为 原子 的 事务 单元 所 执行 的 循环 中 
做 一 些 细节 性 的 工作 。 然 而 ， 有 时 程序 需要 在 一 个 循环 中 提交 多 次 。 例 如 ， 假 设 程 序 循环 完成 将 
所 有 的 雇员 工资 涨 4 铝 。 如 果 在 提交 之 前 执行 整个 循环 ， 我 们 最 后 会 锁 住 这 张 表 的 所 有 行使 它们 
都 不 能 够 被 读 取 ，、 为 了 减少 锁定 的 行 的 数量 ， 我 们 通常 在 对 一 定数 量 的 雇员 (假如 说 是 100 个 ) 创 了 
量 新 后 就 提交 。 这 样 我 们 能 够 在 循环 中 进行 足够 多 的 处 理 ， 以 使 提交 的 开销 不 会 比 逻辑 义理 的 开 
销 多 10 人 和信。 但 是 如 果 我 们 在 每 次 提交 时 丢失 了 游标 所 在 的 位 置 ， 就 要 花 很 大 的 开销 把 这 一 位 置 重 
新 找到 ， 对 于 这 种 情况 ，Core SQL-99 在 Peclare Cursor 语 句 中 指定 了 一 个 可 选 的 WITH HOLD 子 句 : 

EXEC SOL DECLARE cursor name [WITH HOLD] CURSOR FOR 

SUbqUuery 
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FORDER BY result column [AS | DESC] 1, result column [ASC | DESC,.,.}] 
[FOR {READ ONLY | UPDATE [OF columnname [(, columnname ., .17}]; 


当 这 一 选项 有 效 时 ， 跨 越 提 父 时 游标 仍 保 持 打开 的 状态 ， 因 调 它 也 记 住 了 在 坊 
employees 中 的 位 置 。 当 然 在 搜索 的 过 程 中 不 在 目前 被 锁定 范围 内 的 其 他 记录 可 以 改变 ， 这 
是 性 好 事 ! 如 采 我 们 规定 salary 列 每 次 只 能 被 一 个 应 用 程序 更 新 ， 并 且 在 这 一 进程 执行 过 程 中 
不 插入 新 的 不 应 加 工资 的 万 员 的 记录 ， 满 足 了 这 些 ， 更 新 才 有 效 。 我 们 可 以 使 用 一 张 只 有 一 
行 的 特殊 的 表 规 定 这 样 的 一 条 规则 ， 即 所 有 这 样 的 更 新 和 揪 人 必须 在 进行 其 他 工作 之 前 用 更 
新 锁 。 

WITH HOLD 特 性 在 SQIL 标 准 中 是 没有 的 ,但 是 它 出 现在 Core SQL-99 中 意味 着 很 快 就 可 
以 在 一 些 重要 的 数据 库 产品 中 使 用 ，DB2 UDB 就 从 版 本 5 (1997) 开始 提供 这 一 特性 。 
ORACLE 设 有 这 一 子 句 ， 并 且 在 MODE=ORACLE【( 缺 省 ) 的 情况 下 ， 当 Commit 或 Rolliback 时 
关闭 所 有 CURRENT OF 子 句 中 提 到 的 游标 ; 按照 SQL 标准 没有 WITH HOLD 于 名 时 ， 在 
MODE=ANSI 的 情况 下 ， 它 也 将 关闭 所 有 属于 当前 连接 的 游标 。 

从 对 ORACLE 行为 的 这 种 描述 中 我 们 发 现 可 以 通过 避免 使 用 CURRENT OF 动作 来 防 目 提交 
的 时 候 丢失 游标 位 置 。 在 Feteh 循 环 中 抽取 伪 列 ROWID 来 保存 游标 位 置 ， 然 后 使 用 它 执行 查找 
更 新 where rowid = :row_id 而 不 是 where current of cursor 来 完成 任 一 所 需 的 更 新 。 通 过 ROWID 访 
问 提供 了 快速 访问 。 要 得 到 关于 ROWID 更 为 详尽 的 信息 请 参阅 第 8 章 中 的 8.2 节 ， 并 且 关 于 访问 
RID 的 更 多 信息 可 参加 推荐 读物 节 ] 《ORACLES Programmer’” s Guide to the Pro*C/C++ 


Precompiler », 


5.5 过 程 性 SQL 程 序 的 能 力 


在 这 一 节 中 ， 我 们 将 说 明 在 3.11 节 中 非 过 程 的 基本 SQL 语句 不 能 完成 的 任务 是 如 何 通过 过 程 性 
的 方法 完成 的 。( 注意 到 3.6 节 中 一 些 高 级 SQL 语法 也 能 够 扩展 基本 SQL 的 功能 来 完成 这 类 任务 。) 

定制 的 集合 函数 

例 3.10.3 中 指出 了 SQL 中 缺少 求 中 值 的 函数 。 我 们 现在 通过 程序 克服 这 一 路 制 。 


例 5.5.1 ”模拟 一 个 求 中 值 的 函数 。 图 5-21 的 程序 反复 要 求 用 户 输入 c id， 如 果 我 们 可 以 
书写 如 下 的 SQL 语句 ， 就 可 以 显示 出 这 一 中 生 : 

select mediantdcliars)y from orders Where cid = :Cid， 

图 5-21 中 得 到 中 值 的 方法 是 对 crders 表 中 选 到 的 行 的 4o11ars 值 的 个 数 进行 计数 ， 然 后 
在 这 个 订单 行 计数 值 ocount 的 一 半 处 抽取 中 值 。 最 后 抽取 到 的 行 号 为 (ocount+1) /2, 例如 ， 
行 导 1 代表 有 1 条 或 2 条 记录 、 行 号 2 代表 有 3 条 或 4 条 记录 ， 以 此 类 推 。 如 果 行 ocount 是 奇数 ， 
将 给 出 确切 的 中 值 位 置 ; 如 果 ocount 是 偶数 ， 检 索 到 的 值 将 是 两 个 处 于 同样 有 将 的 中 值 位 置 
的 行 中 的 一 行 ， 如 行 号 2 代表 4 行 。 注 意 到 有 一 点 很 重要 ，countO 晒 数 必 须 与 Open Cursor 和 
Fetch 循 环 在 同一 个 事务 中 运行 ， 以 保证 不 会 出 现 因 为 并 发 事务 插 人 所 作 的 改变 导致 中 值 计算 无 
效 。 对 于 dol1lars 的 空 值 情 况 必须 认真 对 待 ， 因 为 在 计算 中 值 时 我 们 不 将 字 值 考虑 在 内 。 注 意 
到 函数 count (dollars) 不 会 对 空 值 计数 ,并且 在 定 闵 dollars_cursor 寺 的 子 句 
where,. .dollars is not null 也 将 忽略 空 值 。 

另外 在 查询 条 件 : . . .where ciq = :cid 中 我 们 看 到 存放 cid 返 问 值 的 变量 名 正 是 它 
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日 身 cid。 这 并 没有 什么 错 ， 因 为 冒号 (清晰 地 将 宿主 变量 和 列 名 区 分 开 了 。 


Hineclude stdio.h> 
#inctude "prompt.h" 
EXEE S91 include Sqlca; 
char custprompt[] = "Please enter a customer ID: "; 
int maint } 
{ 
exac 391 begin declare Sect1ion: 
char cid[5] ,user_namelzd], user_pwd[10]; 
double dollars: int ocount:; 
SXeC Sa end declare section; 
exec 51 declare dollars curser cursdsr Tor 和 
select dollars from orders where cid = :fd and dollars is mot nul] 
order by dollars; 
1nt 1: 
XEC S91 whenever Sqterror goto report_error; 
strcpytuser Naame, “poneilsdgl"y; 
strepytuser_pwd, "ANNX”): 
ExeF Sg] connect :user_name identified by :user_pwd; A* ORACLE tonnect 


while tprompticustprompt, 1, cid, 4 >= 0) [ i* main loop: get cid 

exer sql select countidollarsy into :ocouunt A/* count orders by ci 
from orders where cid = :Cid: 

1f tacount == 0) { 
printit "Ho orders retrieved for cid value tsAn", cid}: 
tontinue; 1* do dUter 1p gain 

] 

/= open cursor and loop unt1l midpoint of ordered sequence 

eset S91 dpen dollars cursor: 

for (i = O: io (ocount+l}yr2: i++) i* fetch at least once 


axec Sql fetch dotlars_cursor into :dollars: 


EXEtE sql close dollars cursor: 
已 其 Sql CoOmmit work; i* release locks 
printf (“Median dollar amount = %fh\n™, dollarsy): 
] 1* end main Toop 
总 记 C 二 年 OMT 5 : A* ORACLE Bisconnect 
return 9; 
report_error: 
print_ dberrort Y: 
axac 39 Follbhack release; ， 7 二 DRACLE Distonnect 1n error*/ 
return 1: 





图 5-21 检索 中 值 的 ORACLE 程序 【 例 5.5.1 的 图 解 ) 
| 
例 5.5.2 千 递 闭 包 ， 纵 出 例 3.10.6 中 的 表 emplocoyees， 我 们 想 要 提示 用 户 输入 si9， 然 
后 检索 最 终 带 有 指定 的 ei a 的 雇员 领导 (通过 一 些 中 间 的 管理 人 人 员 ) 的 所 有 殿 员 。 对 典 人 和 式 
SQIL 来 说 要 完成 这 一 任务 的 难度 是 相当 惊人 的 。 我 们 可 以 建立 一 个 游标 烈 出 直接 归 这 指定 的 
eigd 的 雇员 领导 的 所 有 雇员 ， 然 后 对 于 每 一 位 接受 直接 领导 的 雇员 再 建立 一 个 游标 作为 第 二 
屋 领 导 ， 以 此 类 推 。 但 是 我 们 不 知道 领导 的 层次 总 数 ， 并 昌 由 于 需要 在 一 开始 就 声明 所 有 会 
同时 使 用 的 洲 标 ， 如 采 每 一 层 都 需要 一 个 游标 ， 这 将 是 一 个 很 严重 的 问题 。 我 们 通过 执行 一 
个 略 带 技巧 的 对 雇员 树 进 行 宽 认 优先 搜索 的 双重 循环 来 回 粹 这 一 限制 。 
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注意 ， 所 有 对 数据 库 数据 进行 的 访问 都 在 冰 数 breadth_srch 中 进行 ， 这 正 是 Whenever 
SQLERROR 语 名 放置 的 位 置 。 如 果 我 们 在 两 个 函数 中 都 访问 数据 库 ， 那 么 就 需要 在 每 个 函数 
中 为 GOTO 庆 置 一 个 类 似 “repert_error” 的 标记 ， 否 则 程序 将 不 能 通过 编译 ， 因 为 GOTO 转 移 


的 目标 必须 与 每 条 访问 数据 的 SQL 语 句 在 同一 个 函数 中 。 


#include <stdio.h> 
#include "prompt.h” 

exet SH jncTude sq1ca; 

int breadth srchtchar *start_eid, Tnt cursor_open}; 
int maint } 

{ 









char eid_prompt[j = “Enter Employee ID to $ee all tower level reports: ™ 







char start_eid[6]: 届 

exac SA connect to testdb: A* DB2 UDB Connect, simple form */ 

whiletpromptieid prompt, 1, start_eid, 5) >= 0) { 7 loop for efds wi 
breadth_srehtstart et 二 站) fi* recurse: retrieve subtree 本 






BxEC SHO! COMMIt work: 






} 
exec 59] disconnect current: 







return 8: 
} A ENd main 页 











ExEE S91 DEgIN declare sectinn: 
static char eid[61, ename[ 17?]; 

外 其 人 S01 end declare section: 

exec Sql declare dirrept cursor for select eid, i* cursor ver diract reports wf 

ename from employees where mgrid = :eid; i CF iven employee ed */ 
















int breadth srchichar *start eid, int cursor_ openy 
{ 







char save_eidL6]: A* saved cid for recurston wl 

exer S91 whenever sqlerror goto report_error; 

if tlcursor_cpeny) 1 i* reathed new report subtree si 
strcpyteid, start ei1d}: i* eid is at head of subtree wld 
expc $9l open dirrept; AAA get direct reports of eid wid 







} 
exec Sql whenever not found goto sreh done; A/* return from here when done bd 


xeEd Sq feteh dirrept into :8id, :ename: A newt direct report ba 
printf (™%s Tohn™, eld, ename}: i* print current ename, ed 本 1 









strepytsave_eid, eldy: i* save this eid * 
if tbreadth srechteid, 17<0) return 1: 二 get other emps, this level 
EXec 5s91 close dirrept: i* this level is exhausted 二 
return breadtih_ srcht save _ eid, 0): i* recurse: retrieve subtree 下 







sreh_dones returit 8: 
report. error: print_dberrort }; 
exec sl roliback work: 








return -了 |; 


图 $.22 执行 传递 闭 包 的 DB2 UDB 程 序 
在 图 $-22 的 程序 中 ， 每 一 次 调用 到 随 数 breadth_srch 时 参数 cursor_open==1， 这 意味 着 我 们 


TT ti I 于 
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在 当前 游标 所 在 的 雇员 领导 层次 上 由 左 率 右 的 称 动 ， 做 宽度 优先 搜索 。 因 此 breadth_srch 抽 取 
这 一 层 的 下 一 个 亡 员 ， 显 示 eid 和 ename， 将 eid 值 保存 到 一 个 局 部 变量 中 ， 然 后 通过 购 禽 调 
用 自身 来 得 到 问 一 游标 中 的 下 一 个 雇员 信息 ( 往 右 移动 )。 旋 套 调 用 返 困 的 值 瞳 示 所 有 子 树 已 
被 搜索 完毕 ; 卫 数 breadth_srch 重 建 局 部 值 sid， 再 一 次 打开 一 个 游标 向 下 一 层 搜索 ， 北 归 地 搜 
索 这 些 eiqd 的 子 树 。 当 当前 子 树 的 所 有 低层 雇员 被 搜索 完 之 后 ， 锯 奏 的 breadth_srch 返 回 ， 继 统 
搜索 这 一 层 剩 余 eia 的 子 树 ， 或 者 当 这 一 层 的 eida 已 被 搜索 完 之 后 ， 它 返 加 到 开始 调用 这 一 慨 
breadth_srch 的 地 方 。 最 后 我 们 返回 到 主 静 数 ， 握 交 所 有 工作 ， 并 县 断 开 与 数据 库 的 连接 。 国 


5.6 动态 SQL 


回忆 在 对 散人 式 Selecti 理 名 的 语法 进行 讨论 的 5.3.1 节 中 ， 我 们 提 到 在 搜索 条 件 中 ， 声 明 部 
分 全 名 的 宿主 变量 只 能 被 用 作 常 量 ; 该 变量 不 能 包含 代表 更 为 复 张 的 表达 式 的 字符 串 ， 即 这 
些 语句 的 某 些 部 分 需要 编 详 程序 进行 语法 分 析 。 在 这 :一 节 中 ， 我 们 将 学 习 一 种 新 的 方法 ， 称 
为 动态 SQL， 它 允许 在 宿主 变革 中 构造 - :个 字符 串 作 为 SQL 语句 。 目 前 为 止 我 们 所 看 到 的 瞧 
人 人 式 SQL 语 名 都 称 为 静态 SQL。 动 态 SQL 人 允许 我 们 构造 新 的 在 程序 编译 时 不 能 被 具体 预知 的 
SQL 语句 ， 并 且 随 着 用 户 需求 的 改变 动态 地 执行 它们 。 

T. 立即 执行 

在 程序 中 动态 地 对 新 的 语 甸 进行 语法 分 析 有 许多 好 处 ; 但 是 在 具体 介绍 这 些 优点 之 前 ， 
我 们 需要 先 讲 一 个 例子 。 

例 5.61 立即 执行 图 323 的 程序 中 ， 字 符 数组 sqltext [] 存 储 代表 一 条 SQLi 天 全 的 字符 电 ， 然 后 
对 它 进行 语法 分 析 ， 并 使 用 一 条 新 的 能 人 式 SQL 语 句 Execute Immediate 执 行 它 。 这 一 例子 将 
sqltext [1 的 内 容 设 置 为 一 个 字符 中 常量 ， 但 是 通过 菜单 交互 根据 用 产 的 意愿 来 设置 这 一 字符 串 是 更 
为 普遍 的 用 法 。 这 里 给 出 的 例子 描绘 了 一 条 Delete 语 句 的 立即 执行 ， 对 于 其 他 语 可 ， 如 Update 和 [nsert， 
也 可 以 这 样 做 的 。 然 而 ， 语 句 Select 不 能 用 这 种 语法 执行 ， 它 需要 使 用 男 一 种 方法 ， 稍 后 将 作 和 解释 。 


#inciude <stdio.h> 
exec 9] include sqlca: 


exer sql begin declare section: 
char user_name[] = "stott"; char user_pwd[l = "tiger™: 
char sqttext{i = "delete From customers where cid = e006Y""; 


其 EC 551 en decl are Setction: 
int maint ) 
EXec S91 whenevwer 391error goto report_errors 
exec sg connect suser_name Tdentified by :user_pwd: fe DRACLE Connect 
1 execute Tmmediate 
fw ORACLE Disconnect 


Exact S91 execute 1mmediate :sqltext; 
Exe S91 commit release; 
return 0: 
report_erTror: 
print_dberrort 7; 
exee 391 roilback release: ix DRACLE Disctonnect in error 


returmn 1; 





图 5-23 立即 执行 SQL 语 名 的 ORACLE 程 序 { 例 5.6.1 的 图 解 ) 
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基本 SQL 的 Execute Immediate 语 句 的 一 般 格式 非常 简单 ， 

EXEC SOE EXECUTE IMMEDIATE :host variable; 

宿主 变量 数组 的 字符 申 内 容 必 须 代表 一 条 有 效 的 SQL 语 句 ， 目 前 为 止 我 们 遇 到 的 类 型 
有 :Create Table，Delete( 查 找 删 障 或 者 定位 删除 )，Drop Tapble，Insert，Update( 查 找 更 新 或 者 
定位 更 新 )。 

考虑 一 个 菜单 变 互 ， 当 行 符合 某 一 用 户 定 立 的 条 件 集 合 时 ， 它 允许 用 户 删 除 CAP 数 据 库 
中 customers 表 的 行 。 这些 条 件 可 以 通过 菜单 界面 用 平常 的 语言 表达 ， 如 图 5-24 所 示 。 


Delete customer rows with ALL of the following properties: 
Y_NA Cyustomer orders all products stored in crtry 


Y_NX Customer headquarters ts in city 
Y_NX Customer discount js iD range from te 
，，，fand so ct) 





图 5-24 从 customers 表 中 删除 行 的 示例 菜单 


菜单 用 户 可 以 在 Y 之 后 填写 x( 意味 著 “yes”， 覆 盖 缺 省 和 的 “no”)， 然 后 在 右面 填写 相应 
的 参数 。 程 序 应 该 接受 这 些 选 择 ， 构 造 正 确 的 sqgltext [] 来 完成 所 震 的 Delete 语 句 ， 然 后 立 
即 执行 这 一 语句 。 例 如 ， 假 设 我 们 指定 了 图 5-24 中 的 一 行 如 下 : 


YXN_ Customer headquarters 1 in city _Duluth 


这 里 选择 了 Y， 并 有 在 城市 名 中 填 入 了 “Duluth”。 根 设 程序 已 将 这 一 城市 名 填 入 到 数组 
cname2[] 中 。 程 序 也 必须 初始 化 数组 sqltext[] 来 包括 Delete 语 句 和 的 开始 郭 分， 当然 它 必 
须 留 有 足够 的 空间 : 

Char sqltext[256] = "delete from customers where ": 

程序 现在 就 可 以 来 填充 sqltext[ ] 中 语句 的 剩余 部 分 ， 使 用 库 旺 数 strcat0 将 新 的 字符 串 拼 接 
到 sqltext[ ] 中 ; 


streattsgqltext, “city = \**"): i* concatenate string: city = “ 关上 
strcattsgqltext, cname2} i concatenate cityname: Duluth} ni 
strcat(tsqltext, “AN A* Concetenate quote character: " wd 


注意 到 转 义 字符 QV 必须 在 C 语 言 字 符 串 中 的 单 引号 之 前 使 用 。 以 上 操作 的 结果 与 我 们 书写 
如 下 语句 的 结果 相间 。 

char sqltext[256] = “delete from customers where city = yDuluthy"": 

为 了 确保 数组 sqltext[ ] 没 有 游 出 ， 可 以 使 用 strncat0 代替 strcat()。 

显然 这 一 字符 串 Execute Immediate 的 SQL 语 名 就 会 完成 用 户 的 要 求 。 当 然 我 们 可 能 想 要 
进行 一 些 预 处 理 和 用 户 交 互 以 确定 我 们 要 做 的 正 是 用 户 所 需求 的 ， 特 别 是 在 进行 更 新 操作 时 。 
例如 ， 可 能 应 该 对 所 要 删 去 的 行 数 计数 ， 然 后 询问 用 户 删 去 这 些 数 目的 行 是 否 正 确 。 为 简单 
起 见 ， 下 文 我 位 忽略 这 些 确认 。 

那么 我 们 完 竟 为 什么 需要 Execute Immediate 语 铝 呢 ? 我 们 已 经 会 使 用 查找 删除 语 铝 执行 
删除 ， 它 以 如 下 的 形式 角 人 在 程序 中 : 


exec Sql delete From customers where city = :Cnamez: 


Execute Immediate 语 句 究竟 是 如 何 提高 灵活 性 的 呢 ? 我 们 看 图 5-24 就 可 得 到 答案 ， 图 5-24 


TT r 
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中 烈 出 了 可 供用 户 选 择 的 三 个 不 同 的 选项 ， 通 过 最 后 一 行 “...(and so on )” 暗 示 我 们 还 可 以 有 
史 多 的 选择 。 很 明显 如 果 用 户 在 第 3 行 中 填写 了 新 的 具 容 ， 那 么 我 们 就 需要 一 条 完全 不 同 的 删 
除 格式 ， 例 如 : 


exect sql delete from customers 
Where discnt between :lJowyald and :hivald:; 


这 里 的 1owval13 和 hival13 由 第 3 行 中 的 两 个 填充 格 输入。 在 散人 式 SQL 程 序 中 为 菜单 的 
和 侣 一 行 声明 一 条 不 同 的 Deiete 语 句 ， 看 起 来 是 可 行 的 ， 但 这 并 不 够 ! 设想 如 果 第 2 行 和 第 3 行 都 
被 选中 ， 将 会 怎样 ?这 就 需要 在 程序 中 构造 另外 一 条 骨 人 式 Delete 语 句 。 由 于 在 这 样 -个 菜单 
中 可 能 会 有 15 个 选项 ， 那 么 我 们 最 多 允许 的 选项 子 集 将 为 25， 显 然 使 用 静态 的 SOL 语 句 来 预 
多 所 有 用 户 可 能 的 需求 是 不 现实 的 。 在 源 程序 中 我 们 拒绝 使 用 2 个 不 同 的 Select 语 句 ， 取 而 代 
之 的 是 二 要 能 够 使 用 动态 SQL 在 需要 时 构造 语句 ， 灵 活 地 反映 出 用 户 的 需求 。 

2. Prepare 、Execute 和 Using 

除了 使 用 立即 执行 语句 之 外 ,也 可 以 使 用 两 条 动态 SQL 语句 、Prepare 和 Bxecute， 来 完成 
同样 的 任务 。 这 一 方法 多 许 在 SQL 语句 中 将 宿主 变量 作为 参数 使 用 (通过 Execute 诸 句 的 
USING 了 地 各 完 成)， 并 且 通 过 在 运行 之 前 执行 编译 来 提高 以 某 种 形式 反复 执行 的 语句 的 性 能 。 

例 5.6.2 Prepare、Executs 和 和 Using 图 $-25 给 出 了 一 个 程序 ,在 主 程序 函数 的 第 5 行 中 
的 Prepare 语 急 有 这 样 的 作用 : 它 分 析 selLext[I] 中 字符 串 的 语法 ， 将 它 变 成 一 个 被 编 详 过 的 


#include <stdio,hy> 
exec sql inciude sqlca: 


exec SN begin deciare section: 
char cust_id[S5], sqltext[?56]: 
pxer Sql end declare sectior: 
char cidprompt[] = "Name customer cid to be deleted: " 


int mainet 1】 

{ 
A* The 2 17 the following line marks the dynamic parameter 
strcpyisqltext, "delete from customers Where cid = ?"): 
exeEC sq) whenever sqlerror goto report error: 
exec sql connect to testdb; 


exec sgl prepare delcust from sqltext: i* prepare tor loo0p 
whilettprompttcidprompt, 1, cust_ id.arr, 4)) ?一 六) { /A* loop for eid 
EXeC S09] execute delcust using :cust 1d: tf* Using clauyse ... 
i replaces ”了 above 


EX 日 commit work: i* comit the delete 
] 


BX 59] disconnect current: 


return 0; 
report_error; 
print_dberrort }: 
exec sql rollback WOrk exec sql disconnect current: 
return 1: 





图 5-25 使 用 Prepare 和 Execute 语 句 的 DB2 UPB 程序 《( 例 5.6.2 的 图 解 ) 
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形式 ， 并 俞 名 为 delcust，。 接 下 来 Execute 语 人 句 运 行 delcust。 注 意 到 变量 sgltext 已 经 被 
一 条 包含 动态 参数 ( : dcid}) 的 文本 SQL 语 名 初始 化 。Prepare 语 句 中 随后 的 动态 参数 可 以 由 
Execute 的 USING 子 名 所 指定 的 宿主 变量 值 填 写 。 

这 一 程序 的 Connect 和 Disconnect 语 名 都 使 用 了 DB2 UDB/SQL-99 的 语法， 动态 参数 的 格 
式 "? "也 是 PDB2 UDB/SQL-99 的 语法 。 在 ORACLE 中 ， 除 了 需要 将 Connect 和 Disconnect 语 何 
做 适当 的 修改 外 ， 还 需要 改变 标记 动态 变量 的 "?"， 将 之 谈 为 以 骨气 为 前 缀 的 标识 符 ， 
如 ，:acia， 即 改 为 如 下 形式 : 

strepyt Sql text, “delete from customers where Cid = :dcid™); 

由 于 这 些 参 数 是 使 用 Execute 语 句 的 USING 子 句 按 固定 位 置 顺序 替换 ， 其 实 并 没有 必要 使 
用 :acid 这 样 的 特定 和 名字， 标准 的 "? "更 为 可 取 。 国 

Execute Imtimediate 方 法 提供 了 许多 与 使 用 Prepare-Execute 方 法 的 相同 的 功能 。Prepare 可 
以 接受 的 SQL 语 句 与 Execute Immediate 语 名 所 能 使 用 的 SQL 语句 是 相同 的 ， 所 以 在 这 里 我 们 
得 不 到 任何 灵活 性 。 在 Execute Imnmediate 中 不 能 使 用 USING 子 可 ， 但 因为 变量 的 值 通常 可 以 
被 转换 成 文本 ， 并 且 可 以 被 拼接 成 立即 执行 的 交 本 语句 ， 所 以 这 不 是 -个 严重 的 问题 。 如果 
存在 儿 个 非 文 本 的 变量 值 ，Prepare-Execute 方 法 可 能 会 更 简单 些 ; 和 将 这 些 变量 转换 并 且 连 
接 成 文本 相 比 ， 将 这 些 变量 放置 到 USING 语 可 中 会 更 加 简单 。 一 个 倾向 于 使 用 Brepare- 
也 xecute 方 法 的 更 为 普遍 的 原因 是 性 能 ， 在 这 种 倩 癌 下 语句 必须 证 动态 产生 但 要 重复 执行 。 编 
译 Prebare 语 名 会 消耗 一 些 重 要 的 实 产 ， 因 此 最 好 避 开 编译 形式 的 重复 执行 。Execute 
Immediate 格 式 必须 每 次 重新 编译 一 条 新 的 语句 。 

3. 动态 选择 : Describe 语 名 和 SQLDA 

我 们 还 没有 介绍 动态 建立 和 执行 Select 语 句 。 动 态 建立 Select 膏 名 的 问题 在 于 在 编 伴 之 前 不 
知道 要 检索 的 列 值 的 个 数 ， 因 此 一 般 在 项 态 SQL 中 简单 的 INTO 子 句 证 法 不 能 工作 。 考 虑 语句 ， 


exec Sql select Cname。 discent into :cust. name， :cust discnt 


了 二 ORACLE form «yf 


from customers where cid = :cust_i1d; 
在 声明 了 两 个 知道 类 型 的 宿主 变量 cust_name 和 eust_discnt 来 从 检索 双 的 两 询 中 得 到 值 的 情况 
下 ， 这 -一 语句 将 工作 得 很 好 ，。 但 是 为 了 提供 动态 的 爱 活 性 ， 我 们 允许 检索 表 中 列 的 任意 集合 ， 可 能 是 4 
列 或 者 12 列 ， 并 有 是 任意 的 类 型 。 为 了 处 理 这 些 任 意 检 索 的 集合 ， 我 们 需要 考虑 一 种 新 的 结构 类 型 ， 
称 为 SQL 描 述 符 区 域 (SQL Descriptor Area，SQEDA)。 我 们 首先 介绍 QRACLE 的 数据 库 产品 中 的 动态 Select 
语句 ， 随 后 将 考虑 一 些 SQLDA 的 细 蔬 。 然 后 我 们 会 涉及 DB2 UDB 产 品 中 相应 的 内 容 。 由 于 ORACLE 和 
DB2UDB 中 SQLDA 的 数据 结构 完全 不 同 ， 我 们 不 能 考虑 将 SQLDA 的 任何 用 法 作为 基本 SQL 的 一 部 分 。 


例 5.6.3 考虑 图 5$-26 中 的 ORACLE 程序 ， 靠 近 册 5-26 了 项 部 的 exec sql ,include 
sqg1aa 语 名 包含 了 一 个 定义 SQLDA 结 构 的 头 文件 〈 头 文件 本 身 在 图 $-28 )。 和 在 Connect 语 句 后 
的 第 一 条 语句 初始 化 了 程序 的 SQLDA 指 针 ， 通 过 调用 ORACLE 的 库 遇 数 sqlald0O 使 其 指向 己 初 
始 化 过 的 SQLDA 结 构 。( 这 一 程序 使 用 的 都 是 QRACLE 特 有 的 结构 ， 因 此 我 们 放弃 了 在 每 一 
行 中 以 ORACLE 作为 开头 的 注释 ， 而 是 简单 地 称 之 为 DRACLE 称 厅 .- ) 

一 个 带 有 SQL Select 语 句 的 常量 文本 字符 串 sqltext[ 1] 被 构造 。 类 似 的 常量 字符 串通 常 
不 是 动态 执行 的 ， 由 于 我 们 预先 知道 完整 的 语法 ， 所 以 使 用 报信 式 Select 语 名 会 更 加 简单 ， 然 
而 ， 这 里 我 们 介绍 这 一 简单 的 情况 是 为 了 提供 给 大 家 一 个 较 容 易 理 解 的 具体 例子 。 

当 执行 Prepare 语 句 来 准备 saltext[] Select 语 名 时， 编译 过 程 计 算 Select 语 名 所 检索 的 列 值 
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的 个 数 和 类 型 { 这 里 Seleet 语 句 列 出 了 cname 和 city， 在 Create Table 语 名 中 它们 分 别 被 定义 为 
varchar(13) 和 varchar(20) )。 为 了 让 程序 知道 这 一 信息 ， 它 执行 语句 Pescribe， 这 一 语句 将 检索 到 
的 所 有 列 的 信息 放 到 SQLDA 变 量 结 枸 中 。 注 意 ， 执 行 Describe 之 前 ， 程 序 将 sqldaa->N 设 置 为 
MAX_COLS， 即 允许 列 的 最 大 个 数 ; 实际 上 在 这 里 是 设 有 必要 的 ， 因 为 sqlda->N 已 被 sqlald0 明 
数 正确 初始 化 了 ， 然 而 在 -- 个 重复 使 用 SQLDA 结 构 的 循环 中 ， 这 一 步 是 至 关 重 要 的 。 在 Describe 
语句 执行 完 之 后 ， 程 序 应 当 将 sqlda- >N 设 置 为 由 Describe 所 返回 的 动态 询 实 际 个 数 sqlda->F。 

Describe 语 和 ] 将 每 一 列 的 类 型 说 明 冉 子 了 数组 sql9a->T[]。 然 而 ， 这 些 类 型 说 明 每 一 个 都 有 一 个 
空 值 标记 ( 表 孙 此 列 是 否 允 许 有 空 值 )， 需 要 在 T[ ] 每 一 个 元 素 上 调用 ORACLE 的 sqinul0 峭 数 来 清除 这 
- -标志 , 留 下 一 个 纯 类 型 值 。 这 一 明 数 也 返回 给 调用 者 空 值 标志 ; 如 果 这 --- 列 允许 有 空 值 则 返回 TRUE。 


阐 中 efTnE 机 AX_ECDLS 100 
水 define MAXK_NAME 下 
#1include <stdic.h»> 
include <malloc.h> 
Exee 5 include sgqleca;: 
exec $sql include sqlda; 
SOLDA *sqlaldcint, int, inty: 
exec 5s91 begin declare section: 

eshar sqltext[255]: 

char useér_namefeod], user_pwd[10]: 
exet SHl end declare sectTor: 
int maint 1 


{ 

















int 1, null_eok; SOLDA *s91dé: 

ExEC Sql whenever sqlerror goto report_error: 
strepyt User_name,. “poneilsql"}: strepytuser ped, “XXXX"},; 
EXEC Sql connect :user name identified by :User_pwd: 










s9lda 一 sqlaldtMAx COLS, MAX NAME, DO}: /=* allocatea sqlda var 
5trcpyt sqltext., 

“select cname, city From customers Where cid = YeOD3N'™Y: 
EXEC S91 prepare stmt from :$91text: 
59lda->YN = MAX_COLS; i betore describe, sat th max wi 
exee SH1 describe stmt into sqlda: 
sqlda->N 一 sqlda- >F: 












时 1 








for fi = DO; 1 < sqlda->H; T++) { A* oop through 2 cols 








对 Clear out null flag from TE1}], return it 1n nyull ok variable jy 
sqlnultgtsqida->T[I1]} .sida">TE1], anult_ oky: 

fi* allocate space for the column value plus a null terminator ni 
591da-3YE1] = mallocctint sylda-SLtri]+1y:; 

sqlda-71[i} = malloc(tsizeof(short)): ns aAlioe space for ndicator bs 






] 

exBc S91 declare Crs cursor for stmt: 

exer Sql OPEN ers; 

exer sgl fetch crs using descriptor sqlda; 1* only 1 raow: no loop A 
printrowt sgqlday: ? Print cout row {Fg S27») wi 








exec S91 ciose crs: 
For fi 一 站 :了 < sglda->N: i++y 







Treet sglda- YC1]}: i free col data spate ry 
treetsgqlda-»1[Li]}: Ft free 1ndftcator $horte x 
1} 
好 51 commit Teleases 
return 0} 






Teport_error: 
print dberrort }: 
eXxEC S91 rollback release: 
return 1: 


Te 


* Hep Appendix 让 for code pf 







图 5-26 执行 动态 Select 的 ORACLE 程 序 
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每 一 动态 列 需 要 内 存 区 域 存放 列 值 和 和 指示 带 值 。 这 些 内 存 区 域 通 过 在 SQLDA 中 的 V[] 和 
T[j 数 组 内 俊 置 指向 它们 的 指针 来 指定 。 这 里 我 们 使 用 C 语 言 库 函数 malloe0 分 配 内 存 。 注 意 ， 
malloc0) 方 法 相对 而 言 比较 耗费 CPU， 考 虑 到 这 一 点 ， 程 序 员 应 该 尺 可 能 一 次 性 为 一 组 列 值 分 配 
空间 。 

最 后 ， 声 明了 一 个 命名 为 cr s 的 游标 。 嚼 然 我 们 知道 在 这 一 例子 中 只 会 检索 到 一 行 ， 但 
对 寸 动态 选择 游标 总 是 必须 使 用 的 。 

图 5-27 中 的 阔 数 printrow0) 是 显示 任意 数 基 的 字符 串 类 型 的 列 变量 的 普通 函数 。 将 这 一 孙 
数 简 单 地 扩展 就 可 以 使 之 显示 密 个 不 同 的 列 类 型 。 为 了 做 到 这 一 点 ,我们 需要 从 sgqlaa- 
>T[i] 中 读 取 每 一 列 的 数据 类 型 , 然后 执行 一 条 C 语 言 的 转换 语句 处 理 每 一 种 类 型 。 如 果 乱 费 ， 
可 以 通过 使 用 1 代表 字符 ，3 代 表 整 形 等 等 奉 换 数据 库 类 型 pfil ， 来 完成 类 型 的 强制 转换 。 几 
乎 所 有 的 类 型 部 能 够 被 强制 转换 成 字符 数据 。 很 自然 ， 在 这 种 情况 下 Vv [i] 必须 指 回 足 够 大 的 
可 以 容纳 转换 后 表示 形式 的 内 存 区 域 。 男 外 ，L[i] 也 要 更 新 以 反映 现在 内 存 区 域 的 大 小 。 


iw printrowt ): print two varchar cols in sqlda. for ORACLE 


#include <stdis.h> 
exec 591 include sq1da, 
yoid printrowt SOLDA *sqlda} 
{ 

Char *s: 

int 1 , length; 


for (i = 0; | < sq91lda->N; 1++}) [ i 1o0p through columns 
if ttsqlda->I1[Ci])) { i 1f actually null .. 
Printft “nullin™): i* .display nuli 
} else 1 
Ss = tchar *)sqlda->y[il; i potnt to columhn string value 


liength = sqlda-2t[1]: 
printft*%=s\n". length, s)}: A# print non-nutl string in column 





图 5-27 相 理 多 个 字符 串 迹 量 列 的 ORACLE 咀 数 Printrow 


例 5.6.3 使 用 了 动态 SQL 从 数据 库 检 索 数 据 到 程序 变量 。 在 查找 条 件 中 如 果 使 用 任意 数量 的 
宿主 变量 ， 那 么 由 于 这 些 禹 要 填 人 常数 值 的 子 句 个 数 事先 未 知 ， 因 此 你 的 程序 也 需要 一 种 动 
态 的 方法 来 描述 这 些 任 意 数 量 的 宿主 变量 。 需 要 使 用 语句 Describe Bind Variables 将 这 些 宿主 
变量 绪 定 到 查询 条 件 。 具 体 细 节 请 参阅 本 章 结尾 处 的 推荐 读物 [7] 4 ORACLE Programaaers 
Guide fo the Pro*C/C++ Precompiler ). 

图 5-28 提 供 了 SQLDA 头 文件 中 由 以 下 ORACLE 语 句 渤 取 的 内 容 。 

xe Sol include sqlda: 

ORACLE 中 的 SQLDA 在 多 个 数组 的 数组 项 中 保存 了 列 的 有 关 信 息 ， 这 些 数 组 包括 例 5.6.3 
中 用 到 的 V[] , LE] ，T[] ，I[]。 注 意 ， 数组 T[] 所 指向 的 不 同 数据 类 型 的 代码 不 在 这 一 头 
文件 中 被 定 尽 ， 和 而 是 在 使 用 到 它们 的 沙文 件 中 艇 定 祥 。 

DB2 UDB 在 动态 SQL 方面 与 ORACLE 有 士 分 类 似 的 功能 。SQLDA 结 构 的 部 分 名 字 是 不 同 
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的 ，Include 文 件 需 要 改变 ， 还 有 一 些 其 他 的 小 改动 ， 包 括 通常 的 Connect 和 Diseonnect 语 句 的 
标准 化 。 就 像 在 SQL 标准 ( Full SQL-92 和 SQL-99， 但 不 在 Core SQL-99 ) 里 声明 的 ， 语 句 
Prepare，Desciibe ，Declare Cursor，Open，EFetch 和 Close 的 顺序 也 有 是 一 样 的 。 


struct sglda 

t 
long : Maximum # of columns handled by thnis SOLDs 
char ; pointer to array of pointers to col values 
long : pointer to array of lengths of column values 


short ; pointer to array of types of columns 


short : pointer to aryay of ptrs to nd variables 


1ong ; dctual number of cotumns in th1is SULDS 

char ; pointer to array of pointers toe column names 

short p pointer to array of max Tengths of col names 

short : pointer array of actual Jengths of col names 
char : painter array of addresses of ind var names 
Short : pointer array of max lengths of ind var names 
short : painter array of actual tergths of ind var names 





图 5-28 ORACLE 中 通过 exec sql include sglqa 所 读 到 的 sqlda 结 构 
strurt sqlvar A* Yariabtle Description 


[ 
short sqltype: VarTiable data type 


short sllen: Yariable data iength 
thar 夺 5 和 相生: Fointer to variable data value 
sthort *59ql1ind: Pointer to Null indicator 
struct Sqname; wariable name 

}: 

struct sdlda 

{ 


char $91daid[B]: Eye catcher = ‘SOLDA ' 
SOLDA size Tn bytese=idt 导 OLN 


long $1dabe: 
sqln: Number of SOLYAR elements 


# of columns or host vars. 
first SOLYAR element 


short 
short sqtd: 
struct sglvar sqlvar[l]: 
}: 
iw macre for allocatinyg SOLDA 


#define SOLDASTZECN) {sizeoftstruct syqlday + % 
{tlong} n-1) * sizeoftstruct $91lvar)} 





峰 5-29 DB2 UDB 中 sqidah 的 一 部 分 


SQL 标准 设 有 指明 SQLDA 数 据 结构 ， 所 以 这 一 部 分 在 不 同 的 数据 库 产 品 中 会 在 所 不 同 . 
ORACLE 的 SQLDA 包 含 用 来 描述 列 和 值 的 数字 和 指针 的 数组 ， 而 DB2 UDB 的 SQLDA 有 一 个 结 
构 数 组 存放 相同 的 信息 ， 为 每 一 个 从 数据 库 转移 到 程序 ( 或 反之 ) 的 值 准备 了 一 个 sqlva 结 构 。 
所 以 ， 在 ORACLE 中 ， 指 向 第 个 数据 值 的 指针 通过 sqlda->V[ij 引 用 ， 它 是 SQLDA 中 VY 指针 
数组 的 第 i 个 元 素 ， 而 在 DB2 UDB 中 ， 它 通过 sqlda->sqlvar[i] .sqldata3| 用 ， 这 蚌 
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SQLDA 中 sqlvar 数 组 第 ;个 Sqlvar 结 构 的 sqtdata 成 员 。 和 参见 图 5$-29 得 到 DB2 UDB 声 明 头 文件 
saldaa .h 最 重要 的 部 分 。SQL-92 和 SQL-99 和 标准 用 更 客 的 SQL 关键 字 和 语法 代 蔡 了 产品 中 使 用 
的 SQLDA ， 试 图 使 它们 独立 于 杠 人 的 语言。 然而 ， 这 一 方法 日 前 看 来 还 没有 影响 到 数据 库 产 蜗 
的 发 展 。 

例 5.6.4 给 出 了 与 例 5.6.3 的 ORACLE 产品 的 动态 SQL 和 很 序 相同 纺 能 的 代码 和 详细 的 说 明 . 


例 5.6.4 考虑 图 5-30 的 DB2 UDB 程 序 ， 对 应 于 图 5-26 的 ORACLE 程 序 ， 图 5-30 顶 部 的 包含 
sqlenv.h 遂 过 它 自 刁 包含 sqlda.h 定 义 了 SQLDA 结 构 ( sqglda .h 诡 件 的 一 部 分 在 图 5-29 中 )。 


#define MAX_COLS 1 
#include <s9lenv.hy 
#1include <stdio.h> 
exEc Sql fActude sqlcas: i communicatiorn area 
rod printrowt struct sqlda 本) 
EXEC sot begin declare sectiont: 
char sqltext[ese]: 
BxXEC S59] ENnd declare section: 
int maint } 
[ 
int 证。 struct sqlda *sqlda; 
XBC Sql whenaver sqlerror goto report_error: 
eXEC S59 tonnect to testdb: i* DB2 UDB Connect, simple farm 


sqlda = tstruct sqlda smalloctSOLDASEIECHAN COLSIY: A allocate sqlda area 
strepyt sqltext, "select cname, eity from Customers where cid = VcOO3%'™Y. 

eXec 5941 prepare stmt from :sqltexts A compille selcct statement 
sglda->59In = MAX_COLS: An Set max # dynamic columns 
Bxec sql describe stmt into :*sqTda: rs describe this statement 


For (1 = 0O; Ff < qlda-S59gld; i++y © rt loop through 2 described cols 
A* alinecate space for the colunm value plus # null terminator 
slda-> qlvarC1] .sqldata = MatToctsqlda->s9lYvar[tt].sgqllen + 11. 
sqlda->sqlvar[1].sqlind = malloctsizeoftshort}yy: Co/* gfnd for indicator 

1 

EXEC S30] detlare rs cursor for stmt; 

exer sql Open crs: QPEN CUrFSOr 


BXec sol feteh crs using descriptor :*sqlda; nly 1 row: no 1oup 
printrowt sqiday: Print out row Fig 56.40% 


exec sql Close crss 
for ti = OD; 1 < 5q1da->s41d: +ry 
freet sqlda->sqlvarCt] .sodldatay: free col data Space 
freae{tsqTda->sqlvarf1].soai1rnd): free indicator space 
} 
exec Sql commit work; ExeC sol disconnect currents: or connect reset here 
return 0: 
TEDort error: 
print dberrori }; See Appendix 日 for code 
EXEt SO] rollback work; exec sy1 disconnect current: 
return 1+ 





图 5-30 执行 动态 Select 的 DB2 UDB 程序 


Tt a 
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Conneet 酝 可 之 后 的 第 一 条 霹 杀 初始 化 了 程序 的 SQLDA 指 针 ， 令 它 指 回 通 过 调用 C 语 言 库 函 数 
malloc0 得 到 的 一 个 未 经 初始 化 的 SQLPA 结 构 。 

当 热 行 Prepare 语 句 来 准备 saGltext[] 的 Select 语 句 时 ， 编 译 过 程 计 算 Seleet 语 铝 所 检索 到 
的 列 值 的 个 数 和 类 型 (这 里 Select 语 句 列 出 了 cname 和 cityr， 在 Create Table 诸 句 中 它们 分 别 
被 定 久 为 varchar(13) 和 varchar(20) )。 为 了 让 程序 知道 这 一 信息 ， 执行 语句 Describe， 这 一 语 
多 将 检索 到 的 所 有 列 的 信息 放 到 SQLDA 变 量 结构 中 。 注 意 ， 执 行 Describe 之 前 ， 程 序 将 
sqlda->sgqln 设 置 为 MAX_COLS。, 即 允许 列 的 最 太 个 数 。 执 行 Describe 语 句 之后， 从 
sdlda->sgld 中 可 得 到 由 Describe 近 回 的 动态 州 的 实际 个 数 ,， 

Describe 居 何 将 每 一 列 的 sqlvar 结 构 虐 给 了 数组 salda->sdlvar。 实 际 上 ， 在 Deseribe 
之 后 ，sqlda->sgqlvar[0] .sgllen 纵 吊 了 第 0 列 秆 的 长 度 ， 并 全 sg1da- 
>sqlvar[1] .sqlname 是 描述 第 一 列 值 列 名 的 一 个 结构 。 

每 一 动态 列 需 竖 内 存 区 域 存放 列 值 和 指示 器 值 。 这些 内 存 区 域 通过 在 SQLDA 中 的 
sqlvar 结 构 内 设置 指向 它们 的 指针 来 指定 。 这 里 我 们 使 用 C 语 言 库 函数 malloc0 分 配 内 他 。 注 
意 ，malloc0) 方 法 相对 而 言 比 较 耗 费 CPU， 考 虑 到 这 … 点 ， 程 序 员 应 该 尽 可 能 一 次 性 为 -… 组 列 
值 分 配 空 间 。 

最 后 ， 声 明了 一 个 命名 为 crg 的 游标 。 昌 然 我 们 知道 在 这 一 人 鲍 子 中 只 会 检索 到 : 行 ， 但 
对 十 动态 选择 游标 总 是 必须 使 用 的 。 

图 5-31 给 出 了 这 一 程序 的 printrow 函 数 ， 它 可 以 在 一 个 单独 的 文件 中 ， 这 一 昭 数 与 
ORACLE 中 相应 隔 数 唯一 的 差别 在 于 数据 结构 部 分 的 名 字 。 同 样 它 也 可 以 通过 转换 由 Describe 
所 返回 的 类 型 信息 来 扩展 处 理 各 种 不 同 的 数据 类 型 ， 


1 print two varchar cols currently Tn sqlda, for DBz UDE 
#include <stdin.,h> 
#1include <solenv.h> 
yonid printrowtstruct sqlda *sqtda) 
char *s;: int 1. length: 
for fi = 0: i < s->sgld;: i++) 二 i loop througth columns 
if ft*isoqlda- >aqlvarLi].sqlindy} { 1 if actualtly mult . .，. 


PrintTr mullvim i* .display nul' 


1 else 1 
s = tehar *ysqglda- >sqlvar[i]. sqldata + 2; /* point to string val 
length = soldd->s91lvar[ti].s91len:; fs and find its length 
printt(%rshn". length, gs}: A display non-null value 





图 5-31 处 理 名 个 宇 符 叶 变量 列 的 DB2 UDB 隔 数 Printrow 


5.7 一 些 高 级 的 编程 概念 
本 节 包 括 对 可 滚动 游标 、 游 标 敏 感性 和 数据 库 编程 环境 的 简单 介绍 。 
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1. 可 滚动 游标 

在 图 5-5 之 后 的 讨论 中 我 们 提 到 了 使 用 标准 游标 的 Fetch 语 句 的 一 个 限制 ， 就 是 游标 只 能 在 
一 个 记录 集中 国 前 移动 。 这 意味 着 如 果 要 上 骨 次 检索 基 一 行 ， 就 必须 关闭 并 日 重新 打开 一 :个 游 
标 。 在 Full SQL-92 和 和 Full SQL-99 中 提出 了 对 Declare Cursor 和 和 Fetch 语句 的 汉化。 新 的 Declare 
Cursor 诸 全 在 出 5$-32 中 给 出 。 


EXEC SOL DECLARE cursor name LINSENSITIVEY {SCROLLT CURSOR FWITH HDLDJ 了 FEGR 
Subdquery 
{UNION Subquery] 


[ORDER BY result_column [Asc | DESC} 
{, result_column FASt |DESC]...} 
[FOR READ ONLY | FOR UPDATE OF columnname [, columnname}...]: 





图 5-32 高 级 SQL 的 Peclare Cursor 语 何 


两 个 遍 级 SQL 语 法 元 素 是 关键 字 INSENSITIVE 和 SCROLL。 这 些 不 包括 住 Core SQL-99 中 ， 
但 是 图 $-32 中 其 余 的 语法 在 Core SQL-99 中 都 有 。 我 们 稍 后 就 会 谈 到 游标 敏感 性 。 当 在 游标 定 
义 中 使 用 关键 字 SCROLL 时 ， 这 一 游标 就 被 称 为 是 可 深 动 的 ， 并 日 就 可 以 使 用 SQL-99 中 Fetch 
语句 的 高 级 功能 。 这 一 高 级 5QL 的 Fetch 语 句 在 图 5-33 中 ，。 


EXEC SQL FETCH 
[INEXT | PRIOR | FIRST | LAST -- advanced 


|[{ABSOLUTE | RELATIYE} Value spec} FROM ] -- adyancedy 
cursor_name TNTO hest-variable {, Host-variable,..}: 





图 5-33 高 级 SQ1L 的 Fetch 语 人 句 


位 置 称 动 的 说 明 { NEXT，PRIOR，… ) 被 称 为 定向 。 现 在 标准 的 人 缺 省 动作 是 NEXT， 意 
味 闭 “从 汶 标 现在 的 位 置 起 其 序 检索 下 一 行 "。PRIGR 定 向 意味 着 “检索 游标 当前 所 在 位 置 之 
前 的 那 一 行 "。FIRST 定 向 和 LAST 定 向 检索 游标 所 在 行 集 的 第 一 行 或 最 后 - 行 。4ABSOLUTE 
定向 检索 由 值 vyalue_spec 指 定 的 位 置 的 行 ， 它 可 以 从 1 到 游标 行 集 中 所 有 行 的 个 数 ; 
aABSOLUTE 1 等 同 于 检索 第 一 行 。 人 负 值 也 可 以 使 用 ， 从 -1 到 -n; ABSOLUTE - 1 等 同 于 检 
索 最 后 一 行 。RELATIVE 意 味 着 检索 离 当前 位 置 整 数 个 数 距 离 的 那 行 。 因 此 RELATIVE - 1 同 
PRIOR-- 样 、RELATIVE ] 同 NEXT 、RELATIVE 0 骨 -次 检索 当前 检索 的 这 行 。 

由 于 ORACLE 和 DB2 UDB 在 它们 的 server SQL 中 都 不 直接 支持 这 一 高 级 语法 ， 我 们 不 能 
在 基本 SQL 中 考虑 它们 ， 也 许 你 会 觉得 这 并 不 值得 烦 疮 ; 然而 ，ODBC 是 支持 它 的 ，ODBC 指 
开放 数据 库 连 按 性 (Open Database Conneetivity)，OPBC API 是 一 个 重要 的 C 诸 言 程 序 接口 ， 
它 提供 了 产品 之 间 的 协同 工作 。 要 更 详细 地 了 解 ODBC， 参 阅 本 章 结 束 部 分 的 推荐 读物 [11] 
{The OPDRC Solution 

ODBC 直 接 导 狼 了 java 的 数据 库 连 接 性 包 JDBC(Java Database Connectivity APD 的 产生 。 
JDBC 版 本 2.0 包 含 在 Java 版 本 1.2 中 ， 它 有 可 滚动 的 结果 集 ， 相 当 于 可 深 动 游标 ， 它 世 支 持 铬 
感性 概念 ， 这 一 概念 将 在 后 面 吉 以 介绍 。 可 以 浏览 www.sun.java.com 得 到 更 多 关于 JDBC 的 信 
息 。 一 些 数 据 库 产品 ， 和 包括 DRACLE 和 DB2 UDB 人 也 提供 了 SQLI(Java 的 向 入 式 SQL)， 对 丁 单 
个 数据 库 上 的 简单 的 应 用 进行 处 理 时 它 是 比较 容易 的 。 


TT 
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2. 游标 艇 感性 

回忆 - -下 ， 当 务 这 一 概念 的 产 牛 是 为 了 隔离 某 一 用 户 执 行 的 一 系列 人 逻辑 ， 使 其 不 受 其 他 
并 发 更 新 的 影响 。 我 们 将 征 第 10 章 中 学 习 更 儿 关 于 事务 的 内 容 ， 介 是 这 种 隔 商 意味 着 一 量 在 
一 个 事务 中 打开 了 某 一 游标 ， 这 一 游标 中 的 行 就 不 能 被 任何 其 他 并 发 用 户 更 新 。 这 样 做 很 好 ， 
但 是 在 同一 个 举 务 中 如 果 一 些 对 游标 中 行 所 作 的 更 新 会 对 这 一 事 委 中 一 些 其 他 的 更 新 产生 副 
作用 、 那 么 该 怎么 办 呢 ? 

倒 5.7.1 假设 我 们 编写 一 个 称 为 ora_ship 的 应 用 程序 实际 上 是 装运 已 经 订购 的 货物 。 
orders 表 中 的 订单 还 没有 被 装运 ，ord_ship 逻 辑 找 出 orders 表 中 在 this_mo 月 份 训 购 的 
所 有 订单 ， 调 用 将 这 一 货物 运 给 客户 的 子 程 序 ， 然 后 删除 表 orders 中 的 当前 行 ， 并 将 其 放 
在 与 表 orders 有 相间 列 的 表 shipped_ords 中 , 访问 表 or ders 中 所 有 相关 行 的 游标 如 下 : 

declare cursor ship_em cursor tor 

select * from orders for update of ordne 
where month = :this_mo: 

有 了 时 装运 某 -订单 商品 的 程序 会 返回 值 指 出 由 于 商品 脱销 没 法 装运 。 这 种 情况 下 通常 的 
做 法 是 建立 一 张 后 备 的 订单 ， 意 味 着 当 有 存货 时 就 装运 这 一 订单 上 的 商品 。 最 简单 的 司法 是 
回潮 订单 ， 将 next_mo 的 值 设 为 this_mo 的 下 一 个 月 ， 并 且 用 此 替换 相关 订单 的 month 列 的 
值 。 假 设 我 们 以 如 下 语句 来 实现 这 一 总 : 


update orders set manth 一 :next_mo 


where pid = :ord rec.pigd; 

这 里 cord_rec .pid 就 是 我 们 发 现 的 脱销 商品 的 eid 值 。 现 在 假设 在 游标 ship. em 中 有 
许多 其 他 订单 行 的 pia 正 是 我 们 刚才 遇 到 的 那 一 pia 值 。 那 么 这 些 行 还 在 这 游标 中 存在 吗 ? 
对 于 游标 ship_em 的 orders 行 的 定妆 属性 是 列 month 的 值 为 :this me， 而 现在 这 一 month 
值 改变 了 ， 那么 这 些 行 在 使 用 Fetch 循 环 时 到 底 是 否 被 检索 到 呢 ? 可 能 用 户 会 记得 如 浊 我 们 在 
打开 了 一 个 游标 之 后 改变 了 this_mo 的 值 ， 这 并 不 影响 选 到 的 行 ; 但 是 这 里 的 情况 不 阿 ， 因 
为 我 们 实际 上 在 改变 用 于 限定 游标 所 应 占有 行 的 数据 。 如 果 这 个 答案 太 真 援 卫 ， 那 么 兰 虑 一 
下 ， 如 果 不 是 仅仅 更 新 脱销 商品 订单 行 中 的 month ， 而 是 将 这 些 订单 行 放 到 一 个 不 同 的 表 中 ， 
并 且 从 orders 表 中 删除 订购 这 一 商品 的 行 ， 会 县 样 ? 

delete orders Where pid = :Drf _ree.pid; 

现在 当 我 们 从 游标 ship_em 中 检索 行 时 会 发 生 什 么 情况 ?这 一 - 行 根本 不 存在 ， 所 以 我 们 
不 能 检索 到 。 并 且 Fetch 没 有 办 法 检索 不 存在 的 行 ， 所 以 我 们 不 能 够 将 共 指 向 它 原来 所 在 的 位 
置 ， 可 能 我 们 需要 婚 过 这 一 由 先 脐 的 行 留 下 的 空位 置 。 当 然 有 可 能 当 游 标 最 初 被 打开 时 系统 
会 有 一 个 对 数据 的 “快照 ， 这 样 我 们 就 有 这 些 已 被 删除 的 行 的 拷贝 吕 以 提供 给 Feteh。 关 


对 例 $.7.1 问 题 的 回答 是 在 SQL-92 之 前 设 有 标准 ， 并 且 不 则 的 产品 有 不 同 的 做 法 。 问 题 的 
等 案 可 能 依赖 于 这 一 游标 是 只 读 的 还 是 其 他 类 型 。 然 而 ， 在 Full SQL-92 中 ， 这 一 选择 由 
Declare Cursor 语 法 所 决定 。 再 着 一 下 图 5-32 的 一 般 格 式 ， 注 意 关 键 字 INSENSITIVE。 当 这 一 
关键 字 出 现时 ， 游 标 被 称 为 是 不 敏感 的 ， 这 意味 着 作为 查找 更 新 或 查找 山 除 的 结果 ， 在 这 一 
游标 中 的 行 是 不 会 改变 的 。 这 一 效果 就 好 像 当 游 标 打开 时 系统 对 这 一 游标 中 的 行 做 了 快照 
(然而 ， 这 一 方法 效率 不 高 )。 现 在 程序 可 以 看 到 并 不 在 其 中 的 行 ; 但 是 如 果 执 行 的 是 定位 更 
新 或 定位 删除 【使 用 语法 WHERE CURRENT OF CURSOR )， 会 产生 错误 告知 行 不 存在 。 如 
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果 在 六 照 基本 SQL 坊 能 的 Select 语 句 中 省 去 关键 字 INSENSITIVE， 邦 么 在 游标 外 面 的 更 新 和 删 
除 会 立即 反映 到 这 一 游标 检索 到 的 行 集中 。 在 可 滚动 游标 的 情况 下 ， 这 意味 着 使 用 
ABSOLUTE 23 当 一 行 被 检索 两 次 时 可 能 得 到 不 同 的 结果 。 

3. 数据 库 编程 的 其 他 开发 环境 

一 些 产 品 ， 如 DORACLE、INFORMIX 和 SYBASE， 用 过 程 性 语言 来 扩展 SQL 功 能 。 有 关 
DRACLE(PLASQL) 和 JINFORMIX(SPL) 的 过 程 性 语言 的 某 些 内 容 参 见 4.4 节 。 这 些 面 向 特定 产 
冲 的 语言 通常 有 局 部 的 内 存 变量 、If-then-else 类 型 的 语句 和 建立 、 调 用 函数 的 功能 。 和 多数 情 
况 下 ， 也 存在 一 种 方法 建 守 较为 友好 的 可 视 用 户 界面 ， 如 快速 建立 的 表单 ，、 菜 单 、 通 过 点 击 
控制 在 检索 到 的 游标 上 移动 的 能 力 ， 以 及 其 他 种 种 功能 ， 使 得 开发 应 用 程序 更 加 简单 。DB? 
UDB 现 在 正 使 用 SQLJ(Java 中 的 嵌入 式 SQD) 或 者 Java 的 JDBC 连接 性 包 试图 使 Java 成 为 新 的 更 
安全 的 过 简 人 性 语言 ( 比 它 现 看 所 支持 的 CC++ 和 类 似 的 语言 更 安全 )。 

使 用 过 程 性 诸 言 接口 PL/SQL 和 SPL 的 唯一 困难 在 于 它们 在 细节 上 有 较 多 的 差异 ， 每 种 产 
品 痢 有 自己 的 特点 ,并且 当 前 仅仅 在 SQL-99/PSM ( Persistent Stored Modules， 持 久 的 存储 模 
所 ，SQL-99 的 一 部 分 ) 中 有 一 些 可 遵循 的 标准 。 
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习题 


在 本 书后 的 “习题 解答 ”中 有 答案 的 习题 用 "标记 。 在 编 与 这 些 习 题 的 程序 的 时 候 ， 你 应 
该 知道 可 执行 文件 可 能 相当 大 。 这 是 因为 数据 库 代 码 岸 很 大 ， 而 且 有 时 它们 会 被 捆绑 到 单独 
的 应 用 程序 中 去 。 你 要 注意 限制 你 的 目 冰 下 的 可 执行 文件 的 数目 ， 以 节省 磁盘 空间 。 

注意 习题 5.1 和 5.2 只 涉及 5.] 节 中 和 包 例 的 髋 入 式 SQL 的 特性 ,， 它们 无 需 做 指定 以 外 的 数 

据 安 全 考虑 ， 

5.1 和 输 和 人 例 5.1.2 的 程序 ， 并 针对 你 的 计算 机 上 的 数据 库 产 品 对 它 进 行 必要 的 修改 ， 然 后 
执行 之 。 

5,2。 写 一 个 在 循环 中 提示 用 户 输入 一 个 客户 IP (cia) 和 一 个 产品 ID (pid}( 各 鼎 -- 行 ) 
{使 用 俩 5.1.1 后 介绍 的 prompt0 陨 数 ) 的 程序 。 该 程序 应 该 逐 行 显示 每 一 个 提供 pid 给 cia 的 代 
理 商 的 aid 和 由 每 个 代理 商 提 供 的 qty 总 数 的 列表 。 如 果 提 供 的 cid 或 pid 的 和 值 在 Customers 表 或 
Produets 表 中 不 存在 ， 则 程序 应 该 不 返回 任何 行 。 当 用 户 输 人 一 个 空 行 后 . 程序 应 该 停止 。 

5.3 写 一 个 在 循环 中 提示 用 广 输入 -一个 代理 ID (a19) 和 :个 产品 ID (pid)( 和 名册 一 行 ) 
(使 用 例 5.1.1 后 介绍 的 prompt() 函 数 ) 的 程序 。 该 程序 应 该 妹 行 显示 通过 a id 订 网 pid 的 
customers 的 cid 和 该 顾客 从 该 代理 商 处 订购 的 每 种 产品 的 美元 金额 上 总数 。 如 果 用 户 契 殿 的 
aidqd 或 pia 值 在 agents 或 broducts 表 中 不 存在 ， 则 程序 应 该 下 返 回 件 何 行 。 当 用 广 键 和 人 一 - 
个 空 行 后 ， 程 序 应 该 停止 。 

5.4 修改 习 夺 5.2 的 程序 使 它 在 输入 的 cid 或 pid 不 看 在 于 customers 或 products 表 时 
通知 用 户 并 要 求 用 户 重新 输入 相应 的 cigd 或 者 pid。 特 别 是 ， 鹅 序 要 能 保持 有 效 的 piq， 而 要 
求 重新 输入 错误 的 cid; 或 者 保持 让 效 的 ciq， 而 要 求 重 新 输入 错误 的 pid 一 一 换 名 话说， 就 
是 尽量 减少 用 户 的 击 键 次 数 。 注 意 ， 不 要 修改 prompt( ) 函 数 。 如 果 prompt( ) 为 用 户 输入 的 ciq 
和 pia 返 回 一 个 负 值 ， 就 假设 输入 的 是 一 个 空 行 。 

5.5 这 里 要 求 写 一 个 大 型 的 应 用 程序 。 

{a) 写 -- 个 主 程序 调用 menu( ) 图 数 。menal ) 图 数 为 用 户 提 人 殿 三 个 选项 ; (1) City 
Agent and Customers List, (2) Agent Performance, {3) Exit This Program, 
menu{ ) 函 数 应 该 返回 一 个 值 给 主 程序 。 主 程序 然后 根据 用 户 的 选择 ， 调 用 函数 
city( j 或 performt ) 或 退出 。 在 选择 (1) 或 者 (2) 以 后 ， 生 程序 应 该 循环 调用 menu( ) 
函数 以 获得 进 - - 步 的 输 和 人 。 所 有 这 些 程 序 都 庶 访 有 格式 整齐 的 IO 声明 ， 以 使 用 
户 知 道 到 底 发 生 了 什么 。 

羡 数 city( ) 应 该 要 求 输 人 某 个 城市 的 名 称 〔 例 如 Duluth }， 然 后 返回 居住 于 那个 城 
市 的 顾客 的 cia 列 表 和 代理 商 的 aidq 列 表 。 同 时 ， 两 线 列 表 必 须 满足 以 下 性 质 : 
(1) 两 张 列 表 必 须 用 明确 的 标签 被 区 分 开 ; (2) 列表 中 只 要 列 出 那些 通过 癌 一 个 城 
市 的 某 个 代理 商 至 少 订 购 了 一 次 的 商品 的 顾客 的 cid; 同样 列表 中 只 要 列 出 那些 
至 少 给 一 个 同一 城市 的 顾客 提供 商品 的 代理 商 的 aid; (3) 在 酚 丝 列 表 中 aia 和 
cia 都 分 别 只 出 现 一 次 。 如 果 不 小 心 ， 在 把 一 些 行 播 人 到 orduers 表 中 去 的 时 候 
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就 会 引起 重复。 如 果 不 能 保证 (3)， 那 么 在 一 张 很 大 的 oraers 表 中 就 可 能 出 现 极 
多 的 重复 行 。 注 意 ， 你 必须 在 你 的 程序 中 创建 两 个 游标 以 保证 了 束 性 质 一 一 一 条 
SQL 语 铝 多半 不 能 达到 此 上 月 的 。 可 以 把 cityf ) 衣 数 看 做 被 来 访 的 批发 公司 的 行政 
宫 用 来 联系 顾客 和 他 们 的 代理 商 ， 冲 请 他 们 相互 见面 共 进 晚餐 的 工具 。 

遇 数 perform( ) 应 该 要 求 用 户 输 人 一 个 代理 商 的 aname- 当日 仪 当 在 agents 表 中 
存在 相同 的 aname 的 时 候 ， 程 序 通过 列 出 名 方 aname 的 每 个 代理 商 的 city 和 和 
aid 的 值 ， 并 要 求 用 户 选 择 输入 的 aid 之 一 ， 来 保证 输入 的 代理 商 的 唯一 性 。 然 
后 ，perform( ) 清 数 应 该 计算 该 代理 商 的 销售 总 额 、 各 代理 商 的 销售 总 额 的 最 大 
值 以 及 该 代理 商 的 销售 总 额 与 最 大 值 的 比率 。 





(b) 这 里 是 区 分 同名 代理 商 中 到 底 需 要 哪个 的 男 一 种 办 法 。 取 出 代理 商 和 他 们 所 在 的 


城市 的 列表 ， 标 以 数学 1，2，3，... 并 输出 ， 然 后 要 求 用 户 选 择 - … 个 数字 ,， 在 要求 
用 户 输 人 前 先进 行 提交 。 接 着 使 用 同 游标 声明 重新 取出 行 ， 首 过 指定 的 行 号 计 
数 一 一 这 样 就 得 到 了 需要 找 的 代理 商 。 解 释 为 什么 这 种 方法 在 还 有 其 他 用 户 在 并 
发 地 更 新 数据 库 时 不 保证 有 效 。{(a) 中 的 方法 在 这 种 情况 下 可 对 吗 ”请 给 出 说 明 。 


注意 很 多 干 面 的 编程 作业 显 式 地 或 隐 式 她 和 事务 相关 。 在 下 面 ， 除非 显 式 好 提 到 死 锁 
发 生 的 可 能 ， 你 假设 不 需要 编写 错误 处 理 程 序 米 处 理事 务 死 锁 . 


$5.6 (a) 写 一 个 程序 由 一 个 代理 商 输 入 一 张 洒 单 ， 并 把 它 加 和 人 到 数据 库 中 去 。 主 程序 应 该 


在 循环 中 重复 地 要 求 输入 订货 的 顾客 的 ciq、 供 货 的 代理 商 的 ai8、 订 购 的 商品 
的 Diga、 订 购 商 品 的 数量 auantora 以 及 订单 的 月 份 。 然 后 程序 调用 
do_tansaectioa 孙 数 以 执行 一 个 事务 来 把 订单 训 人 数据 库 。de_transaction 胃 数 的 参 
数 就 是 用 户 输 入 的 值 。 注意 ， 用 户 竹 人 的 值 (ceia，pia 等 ) 在 main(f ) 中 只 是 普 
通 的 程序 变量 ， 所 以 它们 需要 被 复制 到 do_transaction 中 的 SQL 声明 区 域 中 ，。， 首 先 ， 
事务 验证 pid 在 broducts 和 家中、aid 在 agents 表 中 以 及 cid 在 customers 琢 
中 ， 侧 且 products.quantity 减 去 quantora 沾 会 使 products.,quantity 
小 于 0。 人 然后 ,事务 减 去 quantord 个 该 商品 ， 并 利用 proauctrs .price 计 算 这 
些 商 品 的 价值 。 接 着 ， 事 务 减 去 客户 的 折扣 以 调整 价格 。 如 果 piqQ、cida、aid 中 
的 任何 一 -个 不 存在 〈 为 空 ) 或 者 任何 其 他 条 件 不 满足 ， 程 序 应 该 中 止 事 务 ， 接 着 
输出 合适 的 消息 并 从 do_transaction 隔 数 中 返回 。 如 果 所 有 有 的 条 忻 者 满足， 事务 在 
orders 表 中 插入 -一 新 行 ， 并 把 计算 出 来 的 价格 放 在 do11ars 列 中 。orqdne 的 值 
应 该 通过 一 个 特殊 的 调用 来 得 到 ， 此 调用 应 保证 每 次 执行 都 返回 一 个 新 的 值 。 对 
于 此 习题 ， 写 一 个 使 用 一 个 初始 值 为 1027 的 莉 态 安 量 的 中 数 int 
fake_get_ordno{) ， 每 次 调用 该 蚂 数 时 ， 变 量 自 增 ， 并 将 值 返 回 。 最 后 ， 事 
务 应 该 提交 。 该 程序 应 该 注意 事务 死 锁 异常 中 止 。 在 这 种 异常 中 止 发 生 以 后 ,， 事 
务 应 该 重 试 。 重 试 的 次 数 最 多 4 次 。 


(b) 考虑 如 何 实现 get_ordno(l )。 这 是 一 个 即使 在 几 个 程序 同时 使 用 它 时 也 能 保证 返 


回 给 每 个 着 用 者 一 个 新 的 ordno 的 旺 数 。 很 明显 ,我 们 需要 利用 数据 库 本 上午 来 保 
证 一 致 的 行为 。 建 立 内 有 一 行 的 表 ordno， 询 curordno 包 含 了 当前 的 ordno. 
写 short int get_ordno (char *errmsg) 来 访问 并 更 新 此 表 。 它 返回 一 个 新 的 
ordno。 如 果 执 行 失败 ， 就 返回 - 1， 此 时 ，errmsg 中 存放 相关 的 错误 字符 串 。 
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用 一 个 简单 的 驱动 程序 检测 此 函数 。 假 设 get_ratio 函 数 将 在 放 人 订单 的 事务 中 被 
调用 ， 于 是 ， 它 不 应 该 有 自己 的 提交 或 回 深 操作 。 请 说 明 原 因 。 
(c) 注意 (9D) 中 的 ordno 表 将 成 为 多用 户 数 据 库 的 一 个 “热点 ”。 这 是 因为 每 一 个 放 信 
f 单 项 的 事务 都 要 访问 可 中 的 一 行 。 解 释 为 什么 所 有 的 并 发 于 务 在 得 到 crdane 以 
进行 电 己 的 荆 作 之 前 都 必须 等 待 拌 有 当前 crdnoe 的 事 劳 的 提交 或 者 问 税 提高 性 
能 的 一 种 办 法 是 把 获得 ordno 从 订单 项 事务 中 分 离开 来 。 拒 它 放 在 放 人 订单 事务 
之 前 ,作为 一 个 单独 的 事务 。 这 样 ，get_ordno 可 以 有 白 己 的 提交 、 回 深 和 化 锁 重 
试 逻 辑 。 解释 为 什么 在 orders 表 中 的 结果 ordnos 存 存 跳 皮 值 ， 例 如 ，oranos 
1100.1101,1102,1104,…， 用 人 b) 中 的 方法 ， 这 个 问题 会 出 现 吗 ? 
(由 解释 为 什么 在 cida、aia、pia 插 人 人 检测、 是 耕 有 是 侃 数量 的 广 师 满足 要 求 的 检 
测 (事务 的 读 部 分 ) 之 上 后、 以 及 Update 和 Insert 语 名 (事务 的 号 部 分 ) 之 前 不 应 
该 放 团 Commit 语 句 。 在 最 后 一 个 读 写 动作 (insert ) 之 前 有 放置 提交 的 合适 曲 方 
出? 
5.7 考虑 图 5$-13 中 包含 两 个 Update 语 句 事务 的 转账 程序 。 
(a) 设想 在 此 程序 中 没有 任何 事务 包含 这 两 个 单行 Update 语 句 。 导 么 考 虚 几 个 对 应 于 
这 个 改过 的 程序 的 进程 并 发 地 运行 ， 日 没有 其 他 程序 访问 accounts 表 的 情况 。 
请 说 明 “ 如 果 每 个 对 单独 行 的 单个 更 新 不 可 分 的 话 ， 事 务 仍 然 能 够 按照 所 预想 的 
运行 ”的 原 央 。 
tb) 现下 很 贫 另 一 个 进程 正在 运行 给 两 个 账号 增 加 结余 以 作 雇 策 的 程序 。 解释 为 什么 
现在 转账 程序 必须 遵守 可 串 行 化 规范 以 获得 预期 的 结果 。 清 参照 例 5.4.1 回 答 此 问 
题 。 
(c) 需要 一 个 核对 作为 转账 结果 的 账号 的 余额 不 为 负 的 修改 过 的 转账 程序 ( 注意 ,我 
们 假设 aol1lars 变 量 中 的 转账 总 额 可 以 为 负 )。 那 么 应 该 如 何 修 改 程序 ”注意 类 
似 的 代码 在 图 5-20 中 。 
《dj (a 中 的 结论 对 于 (Oy 仍然 有 效 碍 ?有 即 运 行 (c) 中 程 厅 的 不 包含 检测 和 Update 寺 人 的 事 
务 进 程 仍然 能 够 正确 执行 四 ”如 果 发 生 更 新 ， 单 行 的 更 新 仍然 不 可 分 , 但 是 , 更 
新 可 能 根本 就 不 会 发 生 。( 提示 : 转账 总 额 可 以 为 针对 于 考虑 此 问题 至 关 重 要 . ) 
5.% 写 一 个 程序 ， 它 重复 要 求 用 户 输 入 顾客 ID ， 然 后 打印 出 代理 商 名 、 代 理 商 ID 以 及 由 
该 顾客 的 不 同 代理 商 在 他 们 的 美金 总 额 中 间 值 中 放置 的 订单 美金 额 ， 舌 结果 就 像 我 们 执行 了 
如 下 语句 : 
select aname, aid, mediantdollars) ft TNVALID SYNTAN */ 


from orders 
where Ri 过 = :cid group by aname., aid; 


5.9 ” 写 一 个 程序 打印 所 有 代理 商 销售 的 平均 美元 数额 的 总 数 。 并 给 出 一 个 例子 说 明 这 和 


所 有 代理 销售 商 的 总 美元 数 的 平均 值 不 间 。 

5.10， 写 一 个 程序 打印 出 例 3.11.5 中 说 明 的 报表 。 

5.11 按照 例 3.11.6 的 方法 创建 employees 表 。 编写 一 个 程序 ， 它 重复 要 求 用 户 输入 eid， 
程序 按照 在 管理 层次 中 从 下 往 上 地 顺序 输出 接受 eid 守 报 的 经 理 的 序列 。 注 意 程序 应 该 正确 


地 中 止 。 
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注意 把 下 面 的 问题 当 作 可 能 在 考试 中 出 现 的 简 答题 来 回答 ， 


5.12 (ah 编写 一 段 由 exec sgql begin declare section 开 始 的 Ci 语言 代码 ， 声 明 
一 个 名 为 city 的 数组 用 来 存放 agents 表 中 声明 为 varchar(20) 的 citv 澡 称 。 
(b) 。 声 明 一 个 游标 ce。 该 游标 对 应 于 检索 存在 提供 低 于 1 美 苑 商品 的 代理 商 所 在 的 
城市 的 城市 名 《每 个 只 出 现 一 次 ) 的 SQL 查询 。 
(cj， 编写 一 个 循环 连续 地 把 城市 信息 放 介 数组 city 中 去 ， 并 打印 出 它们 。 当 没有 
城市 信息 可 以 检索 的 时 候 ， 循 环 应 该 中 十 。 
5.13 ”编写 可 以 放置 于 可 执行 SQL 语 句 后 以 代 符 以 下 Whenever 语 名 的 等 价 的 测试 {对 
sqlcode 进 行 测试 )。 
(al exec sql whenever not found So to handle_error: 


ch}* exec 5 本] whenever sqlerror go to handle error: 


5,14 考虑 如 下 的 SQL 语 人 句 : 


select ccity, tild, aid, pid 
from customars c, agents a, products p 
where Cc.city = .city and a.city = pcity; 


首先 要 保证 同一 个 城市 中 《c.,city) 的 所 有 (cid，aid， pid) 三 元 组 按 组 出 现 ( -4 
接 一 行 )。 
{a)* 如 何 修 改 上 面 的 SQL 语 句 以 保证 有 相同 的 c .city 国 二 元 组 一 行 接 一 行 地 出 
现 ? 《提示 : 使 用 一 个 非 过 程 性 的 Select 语 句 。) 
fb * 如 果 在 customers 表 中 有 30 行 的 c .cid='New York'，agents 表 中 有 10 行 
的 a ,city-='New York'，products 表 中 有 20 行 的 p.city='New York'。 
那么 上 面 的 SQi 语 名 的 结果 中 有 和 多少 c .city='New York ' 的 行 ? 
(c)* 为 了 限制 在 (b) 这 种 情况 下 看 到 的 信息 数量 ， 要 写 一 个 报表 使 得 每 个 City 只 出 现 
一 次 (作为 标题 )， 下 面 跟着 宇 个 具有 该 city 值 的 cid、aid、pid 值 列表 。 给 
出 伪 代 码 来 表明 你 是 如 何在 央 人 式 SQL 中 做 到 这 一 点 的 .要 注意 游标 的 声明 。) 
5.15 ”假设 在 products 表 中 有 50 个 不 同 的 pia 值 ， 而 且 所 有 这 些 值 都 在 craers 表 中 出 
现 。 现 在 要 列 出 其 中 10 个 最 畅销 商品 的 信息 ， 即 erders 表 中 销售 总 额 最 高 的 商品 的 Pia、 
pname 以 及 销售 总 额 。 
(a}* 用 非 过 程 性 SQL 不 可 能 做 到 这 一 点 。 这 是 因为 没有 办 法 在 效 得 10 个 最 大 销售 额 
的 商品 以 后 就 停止 。 所 以 我 们 划 每 一 个 代入 式 SQL 程 序 ， 它 从 游标 中 得 刘 10 个 
最 高 销售 额 的 商品 。 请 给 出 如 何 声 明 非 过 程 性 SQL 的 游标 ， 以 使 得 所 而 要 的 信 
息 在 获取 行 时 能 尽快 被 得 到 。 
tb)。 在 (al 中 ， 当 在 循环 中 从 游标 提取 行 的 时 候 ， 注 意 如 果 开 始 得 到 doilars 为 空 值 的 
时 候 程 序 可 能 会 页 到 问题 。( 在 某 些 数据 库 产品 中 ， 空 值 在 排序 时 大 于 非 空 
值 ; 而 在 男 一 些 产 品 中 ， 空 值 在 排序 时 小 于 非 空 值 , ) 如 和 何 从 (a) 中 的 标 游 编写 
Fetch 循 环 ， 以 隶 过 提取 到 的 行 的 初始 的 总 额 为 空 的 行 ? 
5.16 考虑 如 下 的 代码 段 ， 其 中 的 两 条 语句 代表 一 个 事务 。 


EXEC 5 中] whenever sqilerror stop; 


吉 5 意 匡 问 纤 据 尺 朱 程序 3237 


begintx: 
XEC S591 Update Fders 
set dollars = dollars - :delta 
where aid = :agentl and Pid = :prodl and cid = Custl; 
exet Sql Update orders 
set dol1lars = dollars + :delta 
Where aid = :agent2 and pid = :rodl and cid = custl: 


重 写 此 代码 段 ， 修 改 并 增加 语句 ， 以 检测 在 事务 执行 过 程 中 可 能 磁 到 的 死 锁 中 止 错误 
(参见 图 5-18 )， 并 让 程序 在 发 生死 锁 时 重 试 这 两 条 语句 。 注 意 ， 你 要 确保 你 的 检测 的 确 有 
效 !1 重 写 以 后 的 我 码 在 这 两 条 语句 成 功 执行 后 应 该 提交 整个 事务 ; 如 条 遇 到 其 他 错误 ， 程 序 
这 辑 应 该 跳 转 到 handle_err。 

5.17 在 动态 SQL 中 ,假设 有 一 个 像 例 4.6.3 中 程序 开始 部 分 那样 的 ORACLE SQLDA 声 明 。 
变量 sqlda 是 一 个 指向 类 型 为 SQLDA 的 结构 的 指针 。 

(a}* 在 Prepare 语 名 后 ,如何 增加 代码 来 提供 输出 数据 的 列 的 标题 ? 如 殷 使 用 
ORACLE， 可 以 利用 列 各 数组 和 sqlaa 一 ML[] 以 及 最 长 询 名 字符 串 长 度数 组 。 
类 似 地 ， 对 于 DB2 UDB， 使 用 salaa 一 sglvar[i] .sgqlname aata 以 蕉 得 
列 和 名 字符 串 ， 使 用 salaa 一 sadlvar[il .sqlname 一 ] ength 以 获得 short int 
型 的 字符 串 长 度 。 

(bj* 在 从 动态 游标 中 抽取 数据 以 后 (在 主 程序 中 )， 如 何 编写 C 代 码 谢 试 是 否 抽取 的 
第 二 列 是 空 值 ? 如果 测试 到 空 值 ， 调 用 handle_null0 晒 数 。) 

5.18 ”编写 一 个 程序 ， 进 行 如 下 循环 : 输出 SQL> 提 示 符 ， 然 后 接受 用 户 的 一 行 输 入 作为 
动态 SQL 语句 执行 ， 如 果 输 入 为 空 行 ， 则 退出 程序 。 这 个 程序 有 点 像 SQL 监 控 器 (如 
ORACLE 的 SQL*Phas ) 的 核心 循环 。 但 是 ， 这 个 简单 的 监控 器 不 能 执行 Select 语 名 。!( 考虑 如 
何 扩展 此 程序 ， 使 之 能 够 执行 Select 语 人 句 。)} 

5.19 ”很 设 你 需要 修改 products 宸 中 的 某 些 商 品名 称 ， 而 且 你 有 一 个 文件 包含 了 每 个 要 
改 各 的 产品 的 pid 和 新 的 pname 字 符 串 { 用 空格 分 开 )。 

(a) 编写 一 个 程序 从 标准 输入 (stdin ) 中 一 行 一 行 地 读 文 件 ， 然后 执行 所 需要 的 更 新 。 
接着 利用 文本 文件 重 定 向 执行 此 程序 。 你 可 以 使 用 带 空 提示 字符 串 的 prompt( ) 孙 
数 从 标准 输入 中 读 取 文件 的 每 一 行 。 对 于 所 需 执 行 的 Update 语 句 ， 使 用 Prepare 和 
Executes 

(b) 作为 另 一 个 选择 ， 使 用 载 人 工具 把 文件 中 各 行 装 人 到 表 pchanges (包含 pid 和 
pname 列 ) 的 行 中 。 请 只 使 用 一 条 SoL 语 名 利用 pchances 表 更 新 Proauctas 表 。 

5.20 我们 希望 从 crdaers 表 中 检索 一 些 列 ， 其 中 被 检索 的 列 由 用 户 指定 。 编 写 一 个 程序 
提示 用 户 逐 个 输入 到 底 要 检索 哪些 列 〔( 输 人 列 名 )， 直 到 用 户 输 和 人 一 个 空 行 为 止 。 然 后 输出 
orders 表 中 所 有 行 的 这 些 列 。 列 的 顺序 按照 用 户 输 入 的 次 序 。 你 需要 像 俩 5.6.3 ( 对 于 
ORACLE 用 户 而 理 ) 或 例 5.6.4 {对 于 DB2 UDB 有 上 用 户 而 言 ) 那样 用 到 动态 SQL 的 所 有 功能 。 在 
DORACLE 中 ， 对 于 gty 和 dol1lars 列 ， 你 可 以 通过 设置 T[i] 为 1， 并 把 L[i] (以 及 内 存 区 ) 
设 得 足够 大 使 得 有 足够 的 空间 来 存放 值 的 文本 形式 。 在 DB2 UDB 中 ， 如 果 需 要 ， 你 可 以 使 用 
SQL 中 的 CAST。 
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到 目前 为 止 ， 我 们 已 经 处 理 了 由 很 多 不 同 的 表 物 成 的 数据 库 ， 但 还 没有 涉及 到 这 些 表 和 
组 成 它们 的 列 最 初 是 如 何 生成 的 。 数 据 库 永 辑 设计 (Logical database design })， 也 被 简单 地 称 
做 数 握 库 设计 (Database design ) 或 者 数据 库 建 模 { Database modeling )， 研 究 数据 项 的 基本 
属性 以 及 它们 之 间 的 相互 关系 。 它 的 日 标 是 用 数据 库 的 基本 数据 结构 表示 现实 世界 中 这 些 数 
据 项 。 具 有 不 同 数据 模型 的 数据 库 ， 它们 表示 数据 的 数据 结构 是 不 同 的 。 在 关系 数据 库 中 ， 
表示 数据 的 数据 结构 就 是 我 们 所 说 的 关系 表 。 我 们 将 在 本 章 中 集中 叙述 关系 数据 库 ， 因 为 对 
得 -关系 模型 的 设计 方法 的 研究 上 旦 前 伪 处 于 初级 阶段 。 希 望 在 这 本 书 将 来 的 版 本 中 ， 我 们 能 够 
对 对 得 -关系 数据 库 的 设计 讨论 得 更 多 一 些 ， 

拯 辑 数据 库 设 计 是 数据 库 管 理 员 ( DBA ) 的 责任。 他 使 用 一 种 方法 将 数据 库 中 相关 联 的 
数据 项 分 配 到 表 的 不 同 列 上 去 ， 这 种 方法 应 当 能 够 保持 所 期 望 的 性 质 。 对 于 逮 辑 数据 库 设 计 
的 最 重要 的 衡量 标准 是 : 表 和 属性 如 实地 反 瞻 钢 实 节 界 对 象 的 相互 关系 ， 并 且 将 洲 在 对 数据 
库 做 任何 可 能 的 更 新 后 ， 依 然 保 持 这 一 点 。 

数据 库 管 理 员 首先 要 研究 一 些 现实 世界 的 实体 ， 比 如 说 一 个 批发 订购 商店 、 一 个 公司 人 
事 部 门 或 者 一 所 大 学 的 登记 管理 部 门 ， 这 些 单位 的 运作 都 需要 计算 机 数据 库 系 统 的 支持 。 数 
据 库 管理 员 通 常 与 某 个 对 该 组 织 细节 有 丰富 经 验 的 人 员 共 同 工 作 ， 逐 渐 提 出 一 个 包 合 数据 项 
和 潜在 数据 对 象 的 列表 ( 例如， 对 于 一 所 大 学 的 登记 管理 部 门 ， 这 张 列表 中 可 能 含有 
student_names, CouUurses, CoOUrse_sections, class rooms, Class_periods 
等 等 })， 同 时 还 要 提出 一 些 与 这 些 数据 项 相互 关系 相关 的 规则 ， 或 称 为 约束 。 下 面 是 典型 的 学 
生 登 记 规 由 

* 每 一 个 登记 在 册 的 学 生 有 一 个 唯一 的 学 号 { 我 们 定义 为 sid )。 

”个 学 年 在 一 个 特定 的 课时 时 间 段 只 能 够 选择 一 门 课 程 。 

* 一 同 教室 在 一 个 特定 的 课时 时 尚 段 只 能 够 提供 给 一 门 课程 使 用 。 

当然 还 有 其 他 一 些 规则 。 根 据 这 些 数 据 项 和 约束 ,数据库 管理 员 将 进行 数据 库 的 多 辑 设 
计 。 在 这 一 章 中 介绍 了 数据 库 设 计 的 两 种 一 般 技术 。 第 一 种 是 实体 -联系 方法 (entity- 
relationship approach )， 或 称 为 E-R 方 法 ; 第 二 种 是 规范 化 方法 。E-R 方 法 试图 提供 一 种 数据 项 
的 分 类 方法 使 数据 库 管 理 员 能 够 直观 地 识别 出 数据 类 别 对 象 的 不 同类 型 (实体 、 弱 实体 、 
属性 、 关 系 等 等 )， 从 而 将 列 册 的 数据 项 及 它们 的 关系 分 类 。 在 创建 表现 这 些 对 得 的 E-R 图 之 
后 ， 数 据 库 管理 员 可 以 通过 一 个 直观 的 过 程 将 设计 转换 成 为 数据 库 系 统 的 关系 表 和 完整 性 约 
束 。 规 范 化 方法 看 起 来 和 E-R 方 法 完全 不 同 ， 而 且 也 许 较 少 依赖 直觉 : 列 出 所 有 数据 项 ， 然 后 
标识 出 所 有 的 相互 关系 规则 《是 可 识别 的 ， 称 为 依赖 )。 设计 开始 时 ， 假 县 所 有 的 数据 项 被 放 
在 一 个 大 的 表 中 ， 然 后 把 这 个 表 分 裂 成 许多 较 小 的 表 。 在 最 终生 成 的 表 集 合 中 检索 原始 数据 
需要 做 连接 操作 。 只 有 当 数 据 库 和 车 理 员 对 现实 世界 数据 关系 以 及 关系 最 终 被 模型 化 的 方法 有 
了 丰 定 的 直觉 的 认识 后 ，E-R 方 法 和 标准 化 方法 才能 被 最 好 地 运用 。 这 两 种 方法 趋 沿 于 生成 相 
同 的 关系 表 设 计 。 事 实 上 它们 相互 提供 对 方 所 需 的 直觉 ， 使 对 方 进行 得 更 好 。 我 们 不 准备 区 
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出 两 种 方法 中 那 种 方法 更 适用 。 

逻辑 数据 库 设计 的 一 个 主旨 特征 是 它 强 调 数 据 项 相互 关系 的 规则 ,没有 经 验 的 用 户 经 常 
把 一 个 美 系 表 看 做 是 由 描述 性 的 列 的 集合 组 成 ， 列 和 列 非 常 相像 .但 这 并 不 准确 ， 央 为 还 有 
很 多 规则 限制 着 列 中 值 之 间 的 可 能 关系 。 回 忆 在 2.2 节 中 ， 我 们 指出 在 customers 家 作为 一 
个 关系 ， 是 四 个 域 的 笠 卡 儿 积 的 一 个 子 集 ，CP=CID x CNAME XCITY x DISCNT。 然 而 ,我 
们 也 指出 在 任何 合法 的 customers 表 中 ， 不 能 有 两 行 的 cid 列 具有 相同 的 值 。 这 是 因为 在 图 
2-1 的 定义 中 cia 被 描述 为 customers 中 行 的 唯一 标识 。 这 里 有 一 个 非常 好 的 例子 来 说 明 我 们 
希望 在 逻辑 数据 库 设 计 中 考虑 的 这 种 规则 。 一 个 如 和 实 反 映 现 实 世 界 的 表 的 表示 通过 指定 cid 
列 是 customers 表 的 候选 刍 或 主键 来 强加 这 一 要 求 。 回 想 一 下 ， 候 选 键 是 表 中 一 个 揪 定 的 询 
集合 ， 以 使 表 中 任意 了 遇 行 在 所 有 这 些 弄 上 的 值 不 相同 ， 并 且 不 存在 该 关键 列 的 一 个 更 小 子 集 
( 真子 集 ) 其 有 这 一 性 质 。 主 键 是 被 数据 库 管 理 员 选 用 的 在 从 其 他 表 引 用 该 袁 时 可 以 唯一 标识 
表 中 行 的 一 个 候选 键 。 

在 计算 机 数据 库 中 对 候选 键 或 主键 的 如 实 表 述 可 以 在 用 SQL 的 Create Table 语 句 建 立 一 个 
表 时 提供 ， 我 们 将 在 第 6 章 中 给 出 这 个 语句 更 完整 的 语法 ， 但 现在 可 以 先 看 一 看 在 图 6-1 的 声 
明 中 给 出 的 诸 法 以 对 它 的 语法 有 一 个 初步 的 印象 。 . 


create table customers (cid chartd) not null, ssn integer not null unidque, 


chname varchartl3),. city varchart20}), dfiscnt real, primary key (cid)}: 





图 6-1 表 customers 的 SQL 声明 ， 主 键 cia， 候 选 键 ssn 


在 Create Table 语 句 中 ssn 列 被 声明 为 非 空 月 唯一， 就 是 说 在 ccstomers 表 的 任何 被 允许 
的 内 容 中 ,不 能 有 两 行 的 ssn 列 含有 相同 的 值 ， 所 以 它 是 一 个 候选 建 。 在 Create Table 便 名 中 
把 cid 声 明 为 主键 使 得 id 成 为 customers 表 中 行 的 标识 ， 这 个 标识 可 以 被 其 他 表 使 用 。 按 照 
图 6-1 的 表 定 义 ， 将 来 任何 使 customers 表 的 两 行 在 cid 列 或 ssn 列 具有 相同 值 的 SQL 的 
Insert 或 Update 语 名 都 是 不 合法 的 并 且 无 效 。 册 此 可 见 ， 表 的 键 的 正确 描述 是 由 数据 库 系 统 维 
护 的 。 另 外 ，Create Table 语 名 的 许多 其 他 子 句 起 着 限制 表 内 容 的 作用 ， 我 们 称 之 为 表 的 完整 
性 的 素 。 必 须 深刻 理解 关系 表 中 列 之 间 的 相互 关系 ， 才 能 正确 理解 约束 。 虽然 不 是 所 有 你 辑 
设计 的 概念 都 可 以 用 今天 的 SQL 来 确切 表述 ， 但 是 SQL 正 阿 着 使 越 来 越 多 这 些 概念 模式 化 的 
方向 发 展 。 无 论 如 何 ， 堵 辑 设 计 的 许多 观点 作为 系统 数据 库 设计 的 辅助 工具 是 非常 有 用 有 网， 
即使 没有 直接 的 系统 支持 也 是 如 此 。 

在 以 下 各 节 中 ， 我 们 首先 介绍 一 些 E-R 模 型 中 的 定义 。 在 有 了 一 些 E-R 的 直观 认识 后 ,将 
介绍 规范 化 进程 。 


6.1 E-RB 概 念 介绍 


实体 -关系 方法 试图 定义 许多 数据 分 类 对 象 ; 然后 数据 库 设 计 人 人 员 就 可 以 通过 直观 的 识别 
将 数据 项 归 类 到 已 知 的 类 别 中 去 。 在 本 节 中 ， 我 们 将 介绍 三 种 基本 的 数据 分 类 对 象 ， 实体 、 
属性 和 关系 。 

1. 实体 、 属 性 和 简单 E-R 图 

我 们 从 实体 这 -概念 的 定义 开始 。 

定义 6.1.1 实体 { entity ) 实体 就 是 具有 公共 性 质 的 可 区 别 的 现实 世界 对 象 的 集合 。 是 
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例如 ， 在 大 学 的 注册 数据 库 中 我 们 可 能 有 以 下 的 实体 ; Students, Instructors,， 
Class_ IOoOcNns, COUrSses, CoOUIrse _ sections, Class_periods 等 等 。 【注意 实体 名 
学 的 首 字 母 大 与 。 ) 很 明显 ， 大 学 的 教室 组 上 成 的 集合 符合 实体 的 定义 ; 实体 class_rooms 中 
的 教室 是 可 区 别 的 (通过 位 置 ， 即 房间 与 码 )， 同 时 还 具有 其 他 一 些 公共 的 属性 ， 如 座位 数目 
(并 不 是 说 具有 相同 的 和 但， 而 是 一 个 公共 的 性 质 )。Class_periods 是 一 个 有 点 令 人 惊奇 的 
实体 一 一 “下 午 2:， 00 到 3: 00” 是 一 个 班 实 志 界 的 对 人 象 吗 ? 但 是 ， 这 里 的 登记 过 程 把 这 些 
课程 时 间 段 当 作 对 象 一 般 邓 待 ， 在 学 生 时 间 表 中 分 配 时 间 段 就 像 分 配 教室 一 样 。 在 我 们 已 经 
作 了 很 刻 工 作 的 CAP 数 据 库 中 ， 可 以 给 出 以 下 实体 的 例子 : Customers, Agents 和 
Products 《oraers 也 是 实体 ， 但 在 这 里 可 能 会 引起 混 请 ， 所 以 我 们 将 在 稍 候 订 论 它 ) 这 
里 我 们 有 一 种 感 党 就 是 实体 将 被 映射 成 关系 表 。 一 个 实体 ， 如 customners， 通 常会 被 映射 成 
一 个 准确 的 瑚 ， 表 的 每 一 行 对 应 于 一 个 可 区 列 的 现实 世界 对 象 (这 些 对 象 组 成 了 实体 )， 称 为 
实体 实例 《entity instance )， 有 时 ， 也 称 为 实体 事件 《entity occurrence ) 

注意 ,我 们 通过 一 些 性 质 区 别 不 同 的 实体 实例 ， 对 比 列 的 值 来 区 划 关 系 表 中 的 行 ， 但 是 
我 们 还 没有 给 这 些 性 质 取 一 个 名 字 。 现 在， 简单 地 说 实体 实例 是 可 区 别 的 ， 就 好 像 我 们 认为 
一 -所 大 学 中 的 教室 是 可 区 别 的 ， 而 不 必 知 道 所 使 用 的 房间 标牌 格式 。 以 后 ， 我 们 总 是 以 一 个 
天 写字 母 开 头 来 写 一 个 实体 名 字 ， 但 是 在 SQL 中 当 实 体 觅 射 为 关系 表 的 时 候 ， 名 字 将 蛮 成 全 
小 写字 和 母 形 式 。 | 

可 以 看 到 ， 我 们 使 用 了 复数 形式 的 实体 和 名称 ; Students, Instructors,， 
Class_rooms 等 等 。 里 为 标准 的 形式 是 使 用 单数 形式 命名 洋 体 : Student, Instructor 
和 Class_room。 我 们 使 用 复数 形式 是 为 了 强调 每 个 实体 实际 上 代表 现实 世界 的 一 个 对 象 全 
合 ， 在 其 中 通常 包含 多 个 元 素 。 上 髓 来 看 看 我 们 的 复数 形式 表 和 名称， 复数 形 式 是 为 了 强调 这 些 
表 中 通常 含有 很 多 的 行 。 在 E-R 图 中 实体 用 和 矩形 框 表示 ,你 可 以 从 图 6-2 中 看 到 这 -- 点 。 

注意 ， 一 些 作 者 使 用 实体 全 或 者 实体 类 型 来 表示 我 们 所 称 的 实体 ， 那 么 对 于 这 些 必 者 而 
言 ， 洋 和 体 就 是 我 们 所 称呼 的 实体 实 芭 。 我 们 也 注意 到 在 某 个 作者 的 六 章 中 偶尔 会 出 现 含糊 ; 
有 了 时候 表 示 一 个 实体 ， 有 时 候 表 示 一 个 实体 集合 。 我 们 假定 在 -个 E-R 图 中 用 矩形 表示 的 对 象 
是 一 个 实体 一 一 现实 世界 对 象 的 集合 一 一 护照 同样 方式 看 待 这 些 和 矩形 的 作者 与 我 们 有 同样 的 定 
吕方 式 。 这 种 售 糊 的 存在 是 和 不平 的， 但 我 们 的 概念 在 后 面 始终 保持 一 敏 。 

在 数学 方式 的 讨论 中 ， 为 了 定义 时 方便 ， 我 们 通常 用 一 个 大 写字 由 代表 一 个 实体 ， 如 果 
有 儿 个 实体 存在 ， 可 以 使 用 下 标 。 例 如 ，E，E,，E,，…。 一 个 实体 E 由 一 个 现实 世界 对 象 的 
集合 构成 ， 我 们 使 用 小 写字 母 加 下 标 表 未 这 些 对 象 : FE={e/，e;，*…，es}。 如 上 面 提 到 的 ， 汝 
使 E 的 侍 一 个 不 同 实例 e 被 称 为 实体 实例 或 者 实体 事件 。 

定义 6.1.2 属性 (attribute } ”属性 是 描述 实体 或 者 关系 { 将 在 上 面 定义 ) 的 性 质 的 
数据 项 。 国 

在 实体 的 定义 中 说 ， 属 于 一 个 实体 的 所 有 实体 实例 具有 共同 性 质 。 在 FE-R 模 型 中 ， 这 些 性 
质 就 是 属性 。 我 们 将 看 到 ，E-R 模 型 中 的 属性 和 关系 模型 中 的 属性 或 列 名 并 没有 什么 令 人 困惑 
的 地 方 ， 因 为 当 E-R 设 计 转 换 成 为 关系 中 术语 时 ， 它 们 是 相对 应 的 。 我 们 说 ， 实 体 的 一 个 特定 
竹 例 具有 描述 实体 的 所 有 属性 的 属性 值 ( 可 以 是 空 值 ) 必须 在 头脑 中 记 住 ， 当 我 们 列 出 某 个 
实体 E 的 所 有 实体 实例 {e，e ，…，e 思 时， 如 果 引 用 属性 值 就 无 法 准确 地 区 别 林 同 的 实例 。 

每 个 实体 有 一 个 标识 符 ， 也 就 是 一 个 属性 或 者 是 一 个 属性 集合 ， 每 个 实体 实例 在 这 些 属 
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性 fF 具 有 不 同 的 值 。 这 类 似 于 关系 中 的 模 选 键 概念 。 举 例 而 言 ， 我 们 为 实体 customers 的 标 
识 符 定 艾 为 客户 标识 符 cidG。- 一 个 实体 可 以 定义 多 个 标识 符 ， 当 数据 库 管理 员 选 定 一 个 单 键 
属性 作为 整个 数据 库 中 实体 实例 的 标识 方法 时 ， 它 就 害 称 为 实 剧 的 主 标识 符 。 其 他 属性 ， 缠 
旭 Custecmers 的 citvy 属 性 ， 不 是 标识 符 而 是 描述 性 属性 ， 被 称 为 描述 符 。 如 同 我 们 在 关系 
模型 中 看 到 的 ， 大 多 数 属性 的 值 是 取 自 某 个 城 的 简单 值 ， 但 是 复合 属性 是 -: 组 共同 描述 一 个 
性 质 的 简单 属性 。 举 例 来 说 ,实体 Students 的 属性 student_names 人 可 以 由 简单 属性 
lname、fname 以 及 midinitial 组 成 。 注意 ,实体 的 标识 和 罕 可 以 包含 复合 属性 。 最 后 ,我 
们 定义 多 值 骆 性 ， 它 尾 在 一 个 实体 实生 中 可 以 取 多 个 值 的 属性 。 例 如 ， 实 体 Employees 可 以 
附加 一 个 称 为 hobpies 的 多 值 属性 ， 取 为 雇员 列 出 的 自己 的 多 个 业余 爱好 或 兴趣 。 -个 雇员 
可 以 有 密 个 业余 爱好 ， 所 以 这 是 一 个 多 值 属性 。 

而 面 提 到 ，E-R 图 用 和 矩形 来 代表 实体 。 图 6-2 显 示 了 两 个 简单 的 E-R 图 .简单 的 单 值 属 性 用 
椭圆 形 表示 ， 并 用 直线 连接 到 实体 。 复 合 属 性 同样 用 椭 莒 形 表示 并 连接 到 实体 ， 同 时 组 成 复 
会 属性 的 简单 属性 连接 到 复合 属性 上 多 值 属性 用 双 线 连接 到 它 所 描述 的 实体 上 .而 不 是 用 
单线 。 主 标识 符 属 性 加 下 划 线 和 表示 。 


hobbies 





图 6-2 具有 实体 各 属性 的 E-R 图 例 


2. 转换 实体 和 属性 到 关系 

我 们 的 最 终 目 标 是 从 E-R 设 计 转 换 到 一 组 数据 库 中 关系 表 的 定义 。 我 们 通过 一 些 转 换 规 则 
实现 这 一 目标 。 

转换 规则 1 BE-R 图 中 的 每 一 个 实体 映射 到 关系 数据 库 中 的 一 个 麦 ， 并 用 实体 名 来 命名 这 
个 表 。 表 的 列 代表 了 连接 到 实体 的 所 有 简单 单 值 属性 (可 能 是 通过 复合 属性 连接 到 实体 的 ， 
但 复合 属性 本 身 并 不 变 成 表 的 列 )。 实体 的 标识 符 映 射 为 该 表 的 候选 键 , 这 将 在 例 6.1.1 中 说 明 ， 
实体 的 主 标识 符 映射 为 主键 。 注 意 到 实体 的 主 标识 符 可 以 是 : -个 复合 属性 ， 所 以 它 将 变 成 为 
关系 表 中 的 一 个 属性 集合 。 实 体 实 例 映射 为 该 表 中 的 行 。 国 


例 6.1.1 这 里 有 两 个 表 , 是 从 图 6-2 中 E-R 图 的 实体 Students 利 Employees 有 映射 而 来 的 ， 
作为 例子 ， 我们 在 每 个 表 中 填写 了 -~ 行 。 主 键 加 下 划 线 表 不 。 
students hp] YeEes 
TE 
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转换 规则 2 ”给 定 一 个 实体 E， 主 标识 是 p。 一 个 多 值 属性 a 在 E-R 图 中 连接 到 E， 那 么 a 爱 射 
成 自身 的 一 个 表 ， 该 表 按 照 复 数 形 式 的 多 值 属性 省 命名 。 这 个 新 表 的 列 用 p 和 a 命名 (Pp 或 a 都 
可 能 由 几 个 属性 组 成 )}、 表 的 行 对 应 (p，a ) 值 对 ， 表 示 与 E 的 实体 实例 关联 的 a 的 属性 值 对 。 
这 个 表 的 主键 属性 是 p 和 a 中 列 的 集合 。 国 

例 6.1.2 ”这 里 是 一 个 数据 库 例 子 ， 两 个 表 反 映 了 图 6-2 中 实体 Employees 以 及 与 之 连接 
的 多 值 属性 hobbies 的 E-R 图 ， 


employees hobbies 


a | ers [oy | sowe | ive 
rms sown | MA | 07102 





















3. 实体 间 联 系 

定义 6.1.3 联系 { relationship ) ”给 定 m 个 实体 的 有 序列 表 : El、E,，-……，E, t 列表 中 辐 
一 个 实体 可 以 出 现 移 于 .- 次 )， 一 个 联系 及 定义 了 这 些 实体 实例 之 癌 的 对 应 规则 。 特 别 地 ，R 
代表 了 一 个 让 元 组 的 集合 ， 它 是 稍 卡 儿 积 E, x E, x … x EE 的 于 集 。 | 

对 应 于 实体 实例 (8;,，e;， …，e,) 的 一 个 元 组 ， 其 中 ,是 定义 中 有 了 序列 表 中 E 的 一 个 实例 ， 
联系 的 一 个 实例 被 称 为 联系 事件 【relationship occurrence ) 或 者 联系 实例 (relationship 
instance )。 定 文 列表 中 实体 数目 m 称 为 联系 的 度 【degree )。 两 个 实体 间 的 联系 称 为 二 元 联系 
(binary relationship )。 例 如 ， 我 们 把 Tnstructors 和 course_sections 之 间 的 联系 定 习 
为 元 联系 teaches。 我 们 把 它 的 一 个 实例 表述 为 -个 特定 的 教师 教授 {teaches) 一 门 特 
定 的 课程 。 咏 一 个 联系 的 例子 是 works_on, 定 义 为 大 公司 中 实体 Employees 和 Projects 之 
半 的 联系 : (Employees works_on Projects ), 

联系 也 可 以 有 附加 的 属性 。 联 系 works_on 可 以 有 属性 Percent ， 表 示 某 个 雇员 的 每 个 
工作 周 中 有 百 分 之 多 少 的 时 间 被 分 配 到 一 项 特定 的 工程 (参见 图 6-3 )。 注 意 ， 如 果 附 加 到 联 
系 works_on 上 的 这 个 percent 属 性 改 为 附 吉 到 实体 Employees 或 Projects 上 的 话 ， 它 将 
是 多 值 的 。 属 性 Percent 只 有 描述 … 个 特定 的 屠 员 -工程 对 的 时 候 才 是 有 意义 的 ， 所 以 它 是 
二 抑 联 系 works_on 的 自然 属性 。 

联系 -个 实体 到 这 个 实体 月 身 的 二 元 联系 (ExE, 的 于 集 ) 叫做 环 (ring 少 有 时 也 叫做 
递归 联系 【iecursive relationship ) 例如 ， 实体 Employees 通 过 联系 manages 与 其 自身 联系 ， 
我 们 说 一 个 雇员 管理 (manages ) 男 一 个 雇员 。 联 系 在 E-R 图 中 用 萎 形 椎 表示 ， 并 用 连接 线 
连接 到 它们 所 联系 的 实体 上 ,至 于 环 的 情况 ， 通常 症 连接 线 上 写 上 所 涉及 的 实体 实例 在 这 个 
联系 中 扮演 的 角色 名称。 在 图 6-3 中 两 个 衣 色 是 manager_of 和 reports_to。 


-mr 1 
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| Instructors teacthes Course_ sections | 


manager. of 


Employees Employees manages 


reports_io 


percent Cpercent) 





图 6-3 具有 联系 的 E-R 图 例子 


注意 ， 我 们 经 常 先 不 考虑 E-R 图 中 的 属性 ， 以 集中 精力 处 理 实体 间 的 联系 ， 使 我 们 不 被 额 
外 的 细节 分 散 注 意 力 。 
例 6.1.3 CAP 中 的 表 orders 并 不 代表 一 个 联系 ”根据 定义 6.1.3，CAP 数 据 库 中 的 去 


oraQere 丰 龙 Cuscomers、&agents 和 Eroducts 之 间 的 联系 。 这 是 因为 涨 orders 行 中 的 一 
刀 组 (cid, aid，pid) 不能 像 要 求 的 那样 确定 笛 - 卡 儿 积 Customers xXAgontsx 
Products 的 一 个 子 集 。 相 反 的 ， 在 图 2-2 的 例子 中 ， 二 元 组 (cid，aid,，pid】) 的 一 些 值 
出 现 不止 一 次 ， 这 显然 是 设计 者 的 意图 ， 因 为 同一 个 顾客 可 以 两 次 从 同一 个 代理 商 处 订购 后 
一 种 产品 。 作 为 对 联系 的 替代 ，orders 表 本 身 代 表 了 一 个 实体 ，ordno 旦 标识 符 。 这 古 常 有 
意义 ,因为 我 们 可 能 因为 某 种 原因 不 得 不 查询 orders 表 中 的 行 ， 却 不 涉及 实体 customers， 
Agents 和 Products 的 实例 。 例 如 ， 我 们 需要 和 检查 尾 否 为 先前 的 一 份 订单 发 出 了 帐 单 和 产品 
(假设 在 图 2-2 的 orders 表 中 没有 这 些 属性 )。 那 么 ，Draers 的 实例 将 被 护照 它们 和 白 身 点 示 
的 对 得 单独 处 理 。 当 然 ， 实 体 0raers 与 实体 Customers， Agents 各 Products 机 联系 ， 
这 将 在 本 章 的 练习 中 进步 探讨 。 图 

里 然 表 orgders 不 直接 与 一 个 联系 对 应 ， 但 是 非常 清楚 ， 按 照 customers， Agents 和 和 
Products 之 同 的 表 orders， 我们 可 以 定义 任何 数 日 的 可 能 联系 

例 6.1.4 很 设 我 们 要 进行 一 项 调查 ， 在 调查 中 需要 知道 当年 所 有 交易 的 总 额 ， 而 这 览 从 
customers，agents 和 products 生 成 的 orders 表 中 得 到 ， 例 如 ， 我们 可 能 要 调查 
agents 和 和 customers 之 间 的 变易 量 关系 ， 也 可 能 调查 custemers 和 products 之 间 的 交易 
量 关 系 ， 以 及 那些 关系 是 如 何 被 节理 因素 (city 的 值 ) 影响 的 。 然 贞 ， 开 始 设计 时 ， 我 们 发 
现 不 断 地 由 表 orders 计 算 总 量 以 获得 这 个 基本 数据 十 分 低 效 ， 所 以 我 们 决定 建 一 个 新 表 
yearlies 用 下 面 的 SQL 命令 定 习 这 个 新 表 

create table yearlies feid chartd}, aid chart3}, pid chart(3}. 


tatqty integer,. totdoll float;: 


insert into yearlies 
select cid, aid, pid. sumtqty}, Sumtdollars’y from orders 


group by cid, Bid, pid; 
-一旦 我们 有 了 新 表 yearlies， 总 额 可 以 在 应 用 逻辑 中 更 新 : 当 新 的 订单 输入 后 ， 相 关 


的 Yearlies 行 也 应 当 被 更 新 。 现 在 ，yearlies 表 是 一 个 联系 ， 国 为 表 中 行 的 :元 组 
(ciqd,aid,pig) 可 以 确定 篆 卡 此 积 Cuatomers x Agents xproducts 的 一 个 子 集 、 也 就 
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是 访 ， 现 在 在 表 yeazr1lies 中 没有 重复 的 二 元 组 卫 。 县 然 这 些 元 组 是 唯一 的 ,那么 《eida， 


aiqd， pid 使 构成 了 表 vear1lies 的 主键 。 图 
六 个 以 上 实体 之 间 的 联系 称 为 N 元 联系 (N-ary relationship )。 王 个 不 问 实体 上 上 的 


联系 叫做 三 元 联系 〈ternary relationship }， 如 联系 yearlies。 N 元 联系 {N>21) 在 
E- 民 图 中 通常 用 多 个 不 辐 的 二 元 联系 代替 。 如 果 这 个 替换 表达 了 这 个 系统 中 真实 的 二 
玫 联 系 ， 那 么 进行 替换 是 -个 好 主意 。 二 元 联系 是 多 数 程 序 员 熟悉 的 ， 并 用 几乎 在 所 
有 详 用 中 ， 使 用 二 元 联系 就 足够 了 .然而 ， 有些 时 候 ， 二 元 联系 不 能 够 分 解 为 二 元 联 
系 。 例 6.1.4 中 联系 yearIiies 表 达 了 一 年 的 顾客 -代理 商 - 产 品 订 购 模 式 一 一 一 个 不 能 
分 解 为 二 元 联系 的 三 元 联系 。 我 们 将 在 本 章 后 面 的 习题 6.4 和 习题 6.21 中 进一步 探究 二 
上 联 系 。 empl oyees 

在 将 E-R 设 计 转 换 成 关系 设计 时 ， 联 系 有 时 被 转换 eid | ename | mgrfd | 
成 一 个 关系 表 ， 有 时 则 不 是 。 我 们 将 在 下 一 节 对 此 进 Le001 | Jasausline | nol 

二 关系 达 
… 步 说 明 。 例 如 ， 联 系 vearlies (一 个 三 元 联系 ) 
转 措 成 ~ 个 关系 表 yearlies。 但 是 Employees 和 


os | psa | so07 
Employees 之 间 的 联系 manages， 如 图 6-3 所 示 ， 并 e005 | Cralg | e002 | 
没有 符 换 成 为 目 身 的 一 张 表 ， 相 反 ， 通 前 这 个 联系 转 


end 

et) 
换 成 表 emplovyveesgs 中 的 一 列 ， 用 来 措 明 请 员 报 上告 的 对 007 
象 ngrid， 如 同 我 们 在 例 3.11.6 中 看 到 的 。 在 图 6-4 中 


我 们 将 这 个 表 重 与 了 上 一遍. 




















注意 虽然 在 表 employeesH 中 mgrid 作 为 一 列 ， 图 6.4 表示 实体 muplovees 的 表 ， 


mgriqd 列 是 关系 模型 中 所 说 的 外 键 , 它 事实 上 对 应 于 图 
6-3 中 E-R 图 的 联系 manages，。 下 一 节 当 我 们 有 机 会 考虑 联系 的 某 些 性 计时 ， 对 此 做 更 多 讨论 。 
作为 这 一 季 的 总 结 ， 图 6-5a 和 图 6-5b 列 出 了 到 现在 为 止 已 经 介绍 的 概念 。 


型 等 世界 中 有 具有 共同 性 质 的 叮 识 别 对 Customers, Agents, 














实体 旬 的 集 售 Products, Employees 
宰 体 : 个 性 质 
属性 描述 实体 或 者 联系 的 某 个 性 质 的 数 见 下 而 
标识 街 (属性 的 集合 ) 唯一 节 标 识 一 个 实体 或 者 联系 实例 局 客 标 识 符 







雇员 标识 符 


， Cswfietascermere 中 小 ， 
描述 符 非 键 属性 ， 描 述 一 个 实体 或 者 联系 
_ CapPacCI ty (lass_roomsq 中 ; 
复合 属性 请 这 一 个 对 销 的 全 个 性 夺 的 组 emp_address [参见 图 6. 
寸 下 一 ' 人 = 
gM | A 个 实体 实例 可 以 取 多 个 人 的 实 。 | hobbies ,委员 图 6 


图 65-5a 茶杯 E-R 概 念 ， 实体 种 记性 
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汪汪 
大生， 标识 笛 卡 儿 积 B， 
x FRR,x .XE, 庄子 全 
两 个 不 问 实体 J 的 联系 teaches, works_on 了 畴 有 图 在 3 


图 和 5b 基本 E-R 概 仿 ， 联系 














6.2 E-R 模 型 的 细节 


我 们 已 经 定义 一些 基 本 概念 ， 现 在 让 我 们 来 讨论 数据 库 设 计 E-R 方 式 中 联系 具有 的 一 些 性 压 ， 

1. 联系 中 实体 的 基数 

图 66 展 示 了 参与 联系 的 一 个 实体 的 最 大 基 歼 和 最 小 基 允 概念 。 图 66 中 《a).《b) 和 《c}， 分别 用 
左边 和 右边 的 集合 表示 实体 E 和 F。 当 联系 R 联 结 两 个 实体 的 实例 时 ， 就 用 -- 笨 育 线 连结 两 个 集合 中 的 
相应 元 素 。 那 么 ， ee hkl Ee dE 


(ai ”一 对 一 联系 ib) ”多 对 一 联系 fe) 
mir-cardiE, RI= 0 min-cardiE, BR} = min- 多 对 守 联 系 = 
max-cardtiE, Ri = 1 max-cardtE, R} = max-cardtE, Rl = 


mijn-cardiF. R}= 0 min-card{F, R} = By min-cardlF. 用 = 


max-card(F. R) = 1 max-card{F, R}= 1 max-card{F, RI = 


这 里 ，F 是 “多 ” 广 





图 6-6 两 个 实体 E 和 F 之 间 联 系 R 的 例子 

一 个 实体 所 参与 的 联系 的 最 小 基数 是 数据 库 管 理 员 所 允许 的 可 以 连结 到 每 个 实体 实例 的 最 
小 连结 线 数 日 。 注意， 图 6-6 只 给 出 了 某 个 特定 时 刻 联 系 的 例子 ， 连 接线 可 能 变化 ， 正 象 一 个 胡 
中 行 的 内 容 会 变化 一 样 ， 直 到 一 些 实体 实例 由 不 同 数 量 的 连结 线 连 结 ， 另 -方面 , 一 个 实体 的 
最 小 和 最 大 基数 性 质 代 表 了 数据 库 管 理 员 制订 的 必须 时 刻 尊 守 的 规则 ， 这 些 规则 沫 能 被 影响 联 
系 的 数据 库 更 新 操作 所 打破 。 在 图 6-6 的 (al) 中 ,可 以 非常 清楚 地 看 到 ， 数 据 库 管理 员 人 允许 实 
休 E 和 F 在 参与 联系 R 时 上 其 有 为 零 的 最 小 基数 ， 也 就 是 说 ， 数 据 库 管 理 员 不 要 求 押 个 实体 实例 都 
被 连结 线 连 结 ， 因 为 其 中 两 个 集合 的 一 些 元 素 没 有 被 连结 线 连结 ， 我 们 用 符 将 表 小 为 min- 
card{E,R)=0 和 min-card(F,R)=0。 然 而 ，E 和 F 在 联系 R 中 的 最 大 基数 从 图 6-6 的 (a) 中 不 能 明显 
地 看 出 来 。 没 有 哪个 实体 实例 被 一 条 以 上 的 连结 线 连结 ， 我 们 不 能 保 让 将 来 连结 线 不 会 改变 以 
使 某 些 实体 实例 有 多 条 连接 线 连 结 到 它 。 然 而 ， 为 了 说 明 简单 ， 我 们 将 假设 图 6-6 中 的 (a) 确 绿 
地 表达 了 数据 库 管 理 员 想 要 设 定 的 基数 。 所 以 ,既然 (a) 中 没有 鄂 个 E 和 F 的 实体 实例 具有 -- 
条 以 上 的 连结 线 ， 我 们 就 把 这 一 事实 表达 为 max-card(E,R)j=1 和 max-cardfFRR)=1。 
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在 图 6-6 的 (b) 中 ,同样 假 设 连 接线 代表 了 设计 者 的 意图 。 因 为 不 是 所 有 的 E 的 元 素 都 有 
连接 线 与 之 连接 ， 所 以 我 们 可 以 写 为 min-card(E,R)=0; 又 因为 F 中 的 每 一 个 元 素 都 至 少 有 - -条 
连接 线 j 之 相连 ， 所 以 我 们 与 为 min-card(F,R)=1。 我 们 的 假设 意味 着 这 两 个 值 不 会 改 蓝 。 我 
们 也 有 max(E,R)=N，N 表 未 “多 于 一 个 "， 尼 表示 设计 者 不 想 把 连接 到 E 的 实例 的 连接 线 数目 
限制 为 1。 然 而 ， 我 们 有 max-card(F.RJ=1， 因 为 FE 的 每 一 个 元 素 愉 有 一 条 线 由 它 发 出 。 现 在 ， 
最 小 基数 使 用 了 两 个 值 0 和 1 ( 实际 F0 根 本 不 是 限制 ， 但 1 表示 限制 条 件 “ 鱼 少 有 一 个 ”)， 基 
大 基数 使 用 了 两 个 值 1 和 N【 事实 上 N 不 是 限制 ， 但 1 表示 限制 条 件 “ 不 多 于 一 个 ”)。 我 们 不 讨 
论 “ 零 ”.“ 一 ”和 “多 ”以 外 的 其 他 数值 。 因 为 mmax-cardfE.R)=N, 所 以 在 这 个 联系 中 有 用 个 F 
的 实 性 实例 连接 到 一 个 E 的 实 剧 实例 。 因 此 ， 在 这 个 多 对 一 的 联系 中 ，F 被 称 为 “多 ” 方 ， 而 
E 被 称 为 “一 ” 方 。( 我 们 将 在 定义 6.2.2 中 给 出 多 对 一 联系 的 严格 定义 。) 

特别 注意 ”多 对 一 联系 中 的 “多 ” 方 是 max-card 值 取 1 的 一 方 ， 在 图 6-6 的 (b) 中 ， 实 

体 五 就 是 多 对 一 联系 中 的 “多 ” 方 ， 尽 管 min-card(PR)=max-card(F,R)=1， 按 照 刚 才 的 解 

释 ， 多 对 一 联系 的 “一 ” 方 是 实体 实例 能 够 参与 多 个 联系 实例 的 一 方 ， 这 些 实 体 实 例 

“射出 多 委 连 接线 ”连结 到 “多 ” 方 的 多 个 实体 实 的 ! 用 这 种 方式 解释 这 个 术语 很 有 意 

义 ， 但 是 这 种 方式 很 容易 被 意 记 ， 而 且 忘 记 它 容 易 导 致 严重 的 混 清 。 

在 图 6-6 的 《ce ) 中 ,我 们 有 min-card(E,R)=0，man-card(F,R)=0，max-card(E,R}=N，max- 
card{F,R)=N。 从 定义 6.2.2 并 始 ,我 们 将 解释 用 于 图 5-6 中 的 二 个 术语 的 合 义 : -对 一 联系 、 多 
对 一 联系 和 多 对 多 联系 。 

例 6.2.1 在 图 6-3 的 联系 teaches 中 ， 教 师 讲 授课 程 (Instructorss teaches 
Course_sections )。 数 据 库 管理 员 可 能 希望 通过 写 min-card(Course_sections, 
teaches)=1 设 定 -一 条 规则 使 一 个 课程 至 少 有 一 个 教师 教授 。 我 们 在 制定 规则 时 需要 十 分 小 心 ， 
因为 它 意 味 着 在 没有 决定 哪 位 教师 来 讲授 的 情况 下 ， 我们 不 能 创建 -- 个 新 的 课程 、 将 它 放 入 数据 
库 、 符 它 分 筑 教 室 和 课时 时 间 段 以 及 人 允许 学 生 选 该 门 课程 。 数 据 库 管理 只 也 可 以 通过 写 max- 
card(Course_sections, teaches)=1 制 定 规则 来 规定 至 多分 配 一 个 教师 来 教授 一 门 课程 . 办 一 
方面 ， 如 果 允 许 有 一 个 以 上 的 教师 分 担 一 门 课程 的 讲授 任务 ， 则 数据 库 管 理 员 可 写 max- 
card(Course_sections,teaches)=N. 很 明显 这 是 一 个 重要 区 别 。 我 们 可 能 并 不 想 制 定 规则 
要 求 每 个 教师 都 要 教授 一 些 课 壬 ( 写 min-eard(Instructors ,teaches)=l), 因为 教师 可 能 休假 ， 
所 以 我 们 写 min-card{Instructors,teaches)=0。 在 大 多 数 的 大 学 中 ， 每 个 学 期 教师 的 半 均 授 
课 数 日 是 大 于 1 的 ， 所 以 我 们 写 max-cardInstructors,teaches)=N。 如 

定义 6.2.1 一 个 实体 E 参 与 联系 RR， 并 昌 min-card(E,R)=x 【x 为 0 或 1 )，max-card(E,R)=y 
(y 为 1 或 N )， 那 么 在 E-R 图 中 ，E 和 R 之 间 的 连接 线 可 以 用 有 序 对 (x, y) 来 标记 。 我 们 使 用 一 个 
新 的 标记 来 表示 这 个 最 小 最 大 有 序 对 (x, y): card(E,R)=(x, 7)。 国 

按照 定义 6.2.1 和 例 6.2.1 的 分 配 ， 连 接 和 实体 Course_sections 到 联系 teaches 的 边 应 访 
用 (1,1) 来 标记 。 在 图 6-7 中 ， 我 们 重复 图 6-3 中 的 E-R 图 ， 并 在 连接 线 上 附 山 了 有 了 序 对 (x,y)， 以 
显示 所 有 实体 -联系 对 的 最 小 和 最 太 芒 数 ,。Instructors teaches Course sections 
图 的 基数 对 遵从 例 6.2.1 中 的 讨论 ， 其 他 一 些 图 用 合理 的 基数 对 标记 。 我 们 做 出 了 一 系列 的 决 
定 ， 达 成 了 下 面 这 些 规则 :每 一 个 和 床上 员 必 须 为 至 少 一 个 工程 工作 《可 以 为 多 个 工程 了 人 作 ) ; 
- -个 工程 在 某 些 时 期 可 以 没有 雇员 被 分 配给 它 【 正 等 待人 员 分 配 )， 当 然 一 些 工程 将 有 庞大 的 
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雇员 队伍 为 其 工作 ; 一 个 雇员 如 果 充 当 manager.of 的 角色 ( 看 下 而 的 计 论 )， 那 么 在 - -个 特 
定 的 时 间 他 可 以 不 管理 任何 亡 员 ， 但 仍然 被 称 为 管理 者 ; 个 雇员 辐 至 多 一 个 管理 青 报 香 工 
作 ， 但 是 可 以 不 向 任何 人 报告 (这 种 可 能 性 是 存在 的 ， 因 为 总 是 存在 个 最 高 层 的 雇员 ， 没 
有 其 他 管理 者 管理 他 ), 


{0, NI {1 1 : 


manager of 


Employees 一 - Emp lovees 


reports Lo 





图 6-7 E-R 图 : 实体 联系 间 的 连接 用 (x.y) 标 * 


在 图 6.7 的 Employees-manages 图 中 ， 按 照 正 常 的 标记 ，card(Employees,manages) 将 是 不 
确定 的 。 我 们 说 ， 实 体 Emp1oyees 在 这 个 联系 中 扮演 了 两 种 不 同 的 角色 : manager_of 和 和 
reports to 角色 。 联 系 manages 的 每 一 个 实例 把 一 个 被 管理 的 雇员 【 扮演 reports_to 角 色 的 
Employees 实例 ) 联系 到 -一 个 管理 者 雇员 【扮演 manager_of 和 角色 的 Employees 实例 )， 我 们 在 实 
体 后 而 加 上 一 个 括号 ， 其 中 填写 该 实体 的 和 角色， 并 使 用 这 种 实体 的 基数 概念 来 消除 不 确定 性 。 划 
cardiEmloyees (reports,_ to), manages}= .0, 1} 相 cardiFErployees {manager_of}, 
manages)} = (0, Nisc 

从 这 些 基 数 中 ， 我 们 看 到 一 个 雇员 如 果 扮 演 了 manager_of 的 角色 ， 那 他 可 能 在 茶 个 时 
间 并 不 管理 任何 其 他 雇员 ， 但 他 仍然 被 叫做 管理 者 。 同 样 ， 一 个 座 员 最 多 向 一 个 管理 者 做 报 
村， 但 是 可 能 并 不 向 任何 人 报告 { 因为 最 高 层 的 雇员 没有 管理 他 的 管理 者-- 一 如 果 个 是 为 
这 个 特殊 的 雇员 ， 我 们 可 以 在 Employeesg-manages 边 的 reports_to 分 交 上 标注 ( 1,1)7. 

2. 一 对 一 联系 、 多 对 多 联系 和 多 对 一 联系 

定义 6.2.2 ” 当 一 个 实体 E 在 联系 R 中 具有 max-card(E,.R)=1 时 ，E 被 称 为 在 联系 R 中 是 单 值 
的 。 如 果 max-card(E,R)=N， 那 么 E 称 为 在 联系 中 是 多 值 的。 如 果实 体 E 和 F 在 联系 中 都 是 多 值 
的 ，、 则 E 和 F 之 闻 的 二 元 联系 R 称 为 是 多 对 多 的 或 N-N 的 。 如 果 E 和 E 都 是 单 值 的 ， 寺 么 这 个 联 
系 称 居 是 一 对 一 的 或 1-4 的 。 如 果 E 是 单 值 的 而 FE 是 多 值 的 或 者 相反 ， 那么 这 个 关系 称 为 是 多 对 
一 的 或 N-1 的 (我 们 通常 不 区 别 1-N 联 系 和 N-1 联 系 )。 | 

前 面 说 到 在 一 个 多 对 一 联系 中 的 “多 ”上 方 吓 具有 单 值 的 一 方 。 可 以 通过 考虑 图 6-7 中 的 联系 
Instructors teaches Course _ sections 来 更 好 地 理解 这 -已 ,这 甲 card 
(Course_ sections,teaches)=(1,1), 实体 course_sections 代 表 了 联系 的 “多 ” 方 。 这 是 央 
为 一 个 教师 可 以 教授 “多 ”ij 课程 ， 反 之 不 然 。 

在 定义 65.2.2 中 ， 我 们 看 到 max-card(E.R) 和 max-card(F,R) 次 定 了 一 个 二 元 联系 是 否 为 多 对 
多 、 多 对 一 或 省 一 对 一 。 男 一 方面 ， min-card(E,R} 和 min-card(F,R) 没 有 被 提 到 ， 我 们 说 它们 
与 这 些 特点 无 关 。 特 别 是 在 图 6-6 的 (bb) 中 min-card(F,R)=1， 与 图 6-6 中 的 (b) 代表 : -个 多 对 一 
联系 的 事实 无 关 。 如 果 在 F 中 还 有 额外 的 元 素 没 有 连接 到 E 中 的 元 素 ( 现 有 的 连接 保持 不 变 )， 
这 将 意味 着 min-card(F,R)=0， 但 是 这 个 变化 不 会 影响 R 是 一 个 多 对 一 联系 的 事实 。 我 们 仍 将 
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看 到 EE 中 的 一 个 元 素 ( 从 焉 数 第 二 个 ) 连接 到 了 F 中 的 两 个 元 素 ， 在 这 里 ， 实 体 F 是 联系 的 
“多 ” 方 。 

虽然 min-card(E,R) 和 min-card(F,R) 并 不 左 石 一 个 联系 R 是 多 对 多 、 允 对 一 还 是 一 对 一 的 ， 
但 是 在 联系 中 ， 参 与 关系 的 另 -- 个 实体 特点 却 是 由 这 些 量 决 定 的 。 

定 必 6.2.3 当 一 个 联系 尺 中 的 实体 E 具 有 min-card(E,R)=1 时 ，E 称 为 强制 大 与 【mandatory 
participation ) RR， 或 者 简单 地 称 为 福 R 中 是 强制 的 。 一 个 实体 E 在 R 中 不 是 强制 的 ， 溃 称 为 可 
选 的 ,或 着 称 为 具有 可 选 和 参与 【optional participation )。 三 

3. 由 二 元 联系 到 关系 

我 们 现在 准备 给 出 从 一 个 二 元 多 对 凶 联 系 的 转 挽 规则 。 

转换 规则 3 N-N 联 系 当 丙 个 实体 E 和 FE 参与 一 个 多 对 多 二 元 联系 R 时 ， 在 相关 的 关系 数据 
库 设 计 中 ， 联 系 映射 成 一 个 表 T。 这 个 表 包 括 从 实体 E 和 F 转 化 而 来 的 两 个 表 的 主键 的 所 有 属 
性 ， 这 些 列 构成 了 表 T 的 主 健 。T 还 包含 了 连结 到 联系 的 所 有 属性 的 列 。 联 系 实 合 用 表 的 行 表 
示 ， 相 关联 的 实体 实 鲍 可 以 通过 这 些 行 的 主键 值 唯一 地 标识 出 。 图 

例 6.2.2 在 图 6-7 中 ，works_on 是 实体 Employees 和 Projects 之 问 的 一 个 多 对 包 联 
系 。 图 68 中 的 关系 设计 按照 转换 规则 1 给 出 了 实体 Employees 对 应 的 关系 瑚 【如 同 例 6.1.2 
中 说 明 的 ) 和 实体 Frojects 对 应 的 表 ; 它 也 遵 德 转换 规则 3 为 联系 works_on 给 出 了 一 个 
关系 表 。 


employees works_on 
straddr city zipeode 


153 Mass 点 ve | Cambridge 1 MA 





Projects 


ee 
Whire 
Mouse 可 


图 6-8 图 6-7 中 Employees works_on Projects 的 关系 设计 





我 们 一 般 假 设 表 employees 的 eid 列 和 表 projectes 的 prid 列 不 能 取 空 从 ， 因 为 它们 
是 各 自 表 的 主键 ， 由 它们 的 唯 -- 值 来 区 别 所 有 的 行 。 同 样 ， 表 works_on 中 列 组 成 的 对 
(eidad,prial 不 能 取 空 值 ， 因 为 每 一 行 必 须 唯 一 地 标识 相关 的 雇员 -工程 对 。 对 于 此 观察 ， 


一 一 Per rm 人 LE rr 


党 6 癌 数据 惟 说 计 249 


我 们 在 2.4 节 末尾 的 关系 规则 4【 实体 完整 性 规则 ) 中 作 了 了 总结 ， 它 表明 -个 关系 表 主 键 的 列 
不 能 电 空 值 。 虽 然 我 们 将 它 称 为 实体 完整 性 规则 ， 介 是 它 同 样 适 用 于 从 E-R 模 型 的 联系 转换 而 
成 的 关系 表 。3.2 节 介绍 的 SQL Create Tabie 庄 甸 提 供 了 在 表 上 强制 元 整 性 约束 的 语法 ， 可 以 网 
你 该 项 则 不 被 打破 ， 即 不 会 出 卉 空 值 . 例如 SQL 闭合 create table projects (prid 
char(3}) not null ...); 人 情 保 Jprojects 表 的 prid 列 在 以 后 的 插入 、 删 际 或 者 更 新 
操作 中 不 会 取 空 值 。 还 有 其 他 一 - 些 约束 可 以 起 到 相同 的 作用 。 | 


转换 规则 4 N-1 联 系 ” 当 两 个 实体 E 和 F 戎 与 一 个 多 对 一 的 二 元 联系 R 时 ， 这 个 联系 在 关系 
数据 库 设 计 中 不 能 被 映射 自身 的 一 个 表 。 相 反 ， 如 果 我 们 假设 实体 F 岂 有 max-card{F,R)=1， 并 
表示 联系 中 的 “多 ” 方 ， 那么 从 实体 F 转 化 成 的 关系 表 T 中 应 当 包 括 从 实体 EE 转换 出 的 关系 表 
的 主键 胡 性 列 ， 这 被 多 为 了 的 下 键 。 因 为 max-card(F,RJ)=1，T 的 每 - - 行 帮 通过 一 个 引 键 值 了 给 系 
到 实体 E 的 一 个 实例 ， 如 果 F 在 R 中 是 强制 参与 的 ， 邦 么 它 必 须 恰 恰 与 E 的 一 个 实例 相 联 系 ， 这 
意味 着 T 的 上 述 外 键 不 能 取 空 值 。 如 果 F 在 R 中 是 选择 参与 的 ， 那 么 T 中 不 与 E 的 实例 相 联系 的 
行 在 外 键 所 有 列 可 以 取 空 值 . | 

例 6.2.3 图 65-9 显 示 出 一 个 图 6-7 中 的 Instructors teaches Course_sections 下 - 
民 图 的 关系 转换 我们 制定 过 一 条 规则 ， 上 老 明 一 个 教师 可 以 教授 多 门 课程 ， 得 是 一 门 谍 程 内 能 
由 一 位 教师 来 束 授 。 家 course_sections 的 训 insid 是 -一 个 外 键 ， 它 将 
course_sections 的 实例 (和 行 ) 联系 到 唯一 一 个 1nstructors 实 例 ( 行 3 


instructors COUTSE_ Sections 


一 


图 69 图 6-7 中 Instructors teaches Course_Secl1ors 的 关系 设计 


SQL 的 Create Table 命 令 可 以 要 求全 不 能 到 空 值 ， 这 就 有 可 能 保证 如 实 摘 述 多 对 一 联系 
中 “ 密 ” 广 实体 的 强制 参与 、 我 们 可 以 建立 表 course_seckricons， 在 insioaq 列 上 不 能 为 空 
值 : 我 们 所 说 的 “如 实 ” 是 指 用 户 不 可 能 通过 一 个 不 吉 考 感 的 更 新 操 必 绩 邱 数据， 因为 SQL 
不 会 介 许 一 个 course_sections 行 的 insid 介 有 空 值 。 我 们 将 在 下 - 章 中 看 到 ，SQL 岂 可 
书 强 制约 束 表 course_sections 中 的 外 键 insiad 的 值 惟 恰 是 在 表 instructors 的 主键 列 
insiqd 中 出 现 过 的 值 ， 这 个 约束 称 为 参照 完整 性 (referential integrity )。 者 

不 幸 的 是 ， 在 标准 SQL 中 不 可 能 保证 多 对 一 联系 中 “一 ” 方 的 强制 参与 ， 或 者 多 对 多 联 
系 中 任何 一 方 的 强制 参与 。 所 以 在 便 6.2.3 中 ， 没 有 办 法 在 SQL 表 定义 中 给 出 一 个 如 实 描述 来 
确保 每 一 个 教师 至 少 教授 一 门 珠 程 。 

注意 ， 对 于 联系 的 -- 些 E- 灵 转换 规则 不 同 的 文章 中 有 不 同 的 观点 、 推 荐 读物 [4] 给 出 了 N-1 
联系 转换 规 对 4 的 等 价 表述 ,但 是 推荐 读物 [1 提供 了 -一 个 不 同 的 替代 转换 ， 那 里 如 果 联 系 中 
“和 多” 方 实体 是 可 选 参与 ， 联 系 被 映射 为 自身 对 应 的 一 个 表 。 这样 做 的 永 内 是 为 了 避免 在 外 键 
中 太 基 使 用 空 什 ( 例 6.2.3 course_sections 中 的 jnsid)， 但 是 使 用 空 值 看 起 来 没有 什么 
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问题 ， 所 以 我 们 遵循 推荐 读物 [和 中 的 转换 方法 。 

转换 规则 5 1-1 联 系 ， 可 选 参与 ”给 定 两 个 实体 E 和 FE， 他 们 参 与 一 对 一 一 元 联系 R， 一 者 
的 参与 都 是 可 选 的 。 我 们 希望 将 这 一 情形 转换 为 关系 设计 。 为 此 ， 我 们 首先 按照 转换 规则 1 建 
立 表 5 来 表示 实体 E; 同样 建立 表 T 表 示 实 体 F。 然 后 我 们 和 何 表 T 中 瘫 加 一 组 烈 (作为 外 键 )， 这 
些 列 在 表 S 构 成 主键 。 如 果 上 愿意， 还 可 以 在 表 S 中 加 入 一 组 外 键 列 ( 表 T 中 主键 的 列 )。 对 于 R 
的 任何 联系 实例 ， 痢 有 唯 -一 个 E 的 实例 联系 到 唯一 一 个 F 的 实例 一 一 在 S 和 T 的 对 应 行 中 ， 外 


键 列 填 写 的 值 引 用 男 一 张 表 相 应 行 ， 这 一 联系 是 RR 的 实例 确定 的 国 
转换 规则 6 ”1-1 联系 ， 两 边 均 强制 参与 ”对 于 - -个 两 方 都 是 强制 参与 的 一 对 -联系 ,最 好 
将 两 个 实体 对 应 的 两 个 表 合 并 成 为 一 个 表 ， 这 样 可 以 避免 使 用 外 键 。 本 


我 们 没有 给 出 所 有 可 能 的 N 元 联系 (N>21) 的 转换 规则 。 通 常 这 些 NA 联系 都 转换 成 目 己 
对 应 的 表 。 查 是 如 果 踪 去 一 个 实体 外 其 余 参 与 联系 的 所 有 实体 都 带 有 inax-card=1， 那 么 可 以 
在 那个 具有 较 大 基数 的 参与 实体 对 应 的 表 中 ， 加 入 N-1 个 外 键 来 表示 这 个 联系 。 


6.3 其 他 E-R 概 念 


在 这 一 节 中 ， 我 们 介绍 E-R 模 型 中 其 他 一 些 非常 有 用 的 概念 ，。 

1. 属性 的 基 裁 

首先 ， 我 们 注意 到 min-cardimax-card 概 念 可 以 用 来 描述 隶属 于 实体 的 属性 的 基数 。 

定义 6.3.1 给 定 一 个 实体 E 和 隶属 十 它 的 属性 A ， 我 们 用 min-card(A,E)=0 来 表示 属性 A 是 
可 选 的 ， 用 min-card(A,E)=1 米 表示 属性 A 是 强制 的 。 一 个 强制 的 属性 应 当 与 一 个 烈 相对 族 ， 
这 个 列 在 实体 E 对 应 的 表 中 声明 且 不 能 取 空 值 ,我们 用 max-card{A,E)=1 来 表示 属性 是 单 值 的 ， 
max-card(A,E)=N 来 表示 属性 是 多 值 的 。 一 个 属性 A， 当 min-card(A,E)=x 且 max-card(A.E)=y 
了 时， 就 写 为 card(A,B)=(x, 3)。(x, 妨 可 以 有 来 标记 E-R 图 中 属性 -实体 疗 的 连接 ， 以 显示 这 个 属 
性 的 基数 。 站 

在 E-R 图 中 用 汕 有 标记 的 连接 线 连 接 的 属性 如 果 是 描述 符 属 性 ， 虽 可 以 假设 有 具有 基数 
(0,1); 如 果 是 标识 符 属 性 ， 则 可 以 假设 具有 基数 (1,1)。 图 6-10 概 要 地 重 述 了 图 6-2， 并 在 属性 - 
实体 连接 钱 寺 作 了 标记 。({ 注意 ,这些 并 不 是 在 网 6-2 中 我 们 所 期 望 的 缺 省 基数 ， 没 有 标记 基 
数 是 因为 那 时 还 没有 介绍 这 个 概念 。) 


Ce ) 
AN) 


1 
,1 Emplovyees 
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(1, 1) 
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图 5-10 标注 了 属性 和 实体 间 连 接线 的 E-R 图 
在 图 5-10 中 ， 我 们 看 到 属性 midinitial 是 可 选 的 (有些 人 没有 中 间 溃 )。Students 的 
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复合 属性 student_names 是 强制 的 , 但 是 Employees 的 属性 emp_adadaress 是 可 选 的 。 然 
而 ， 如 采 emP_adaress 存 在， 那么 所 有 组 成 地 址 的 四 个 简单 属性 都 是 强制 的 。sia 和 eia 的 
都 具有 基数 (1,1); 对 于 实体 标识 符 而 言 总 是 如 此 。 多 值 属 性 hopbies 的 max-card 值 为 N， 我 
们 可 以 看 到 图 中 它 通过 一 条 驱 线 连接 到 它 的 实体 ，min-ecard(hobbies,Employees)=1， 这 
可 能 有 些 令 人 怀 讶 ， 它 说 明 数 据 庆 中 记录 的 雇员 必须 有 至 少 一 个 业余 爱好 ， 

2. 磁 实 体 

定义 6.3.2 如 此 实体 的 所 有 实例 都 通过 一 个 联系 R 依 赖 于 坊 一 个 实体 的 实例 而 存在 ， 那么 
这 个 实体 就 称 为 弱 实 体 ， 而 另 - :个 实体 称 为 强 实体 。 国 

作为 -个 例子 ， 我 们 在 CAP 设 计 中 已 经 假设 ， 一 个 订单 详细 说 明了 顾客 、 代 理 商 、 产 品 、 
数量 和 人 金额。 通常 的 设计 变种 看 允许 一 次 订购 多 个 产品 ， 那 么 将 创建 去 oraers 来 连接 
customers 和 agents 的 有， 同样 表 1ine_ items 和 包含 了 每 个 产品 的 购买 记录 ; 表 
1ine_items 中 的 移行 对 应 于 一 个 orders 实 例 ， 在 图 6-11 中 给 出 了 这 个 设计 的 BE-R 模 型 ， 


for_prod 





图 6-11 一 个 弱 实 体 Line_items， 依 融 于 实体 Draars 


如 我 们 所 见 ， 实 体 Oraders 在 与 Line_icems 的 联系 中 是 可 选 的 ， 因 为 每 个 订单 开始 时 
总 是 空门 的 。Line_items 在 联系 中 是 强制 的 ， 因 为 一 个 可 购 条 目 行 不 可 能 脱离 包含 记 来 为 
该 订单 指定 顾客 和 代理 商 的 订单 而 存在 。 如 果 orders 的 实例 不 存在 了 【顾客 取消 了 尼 )， 那 
么 弱 实 体 Line_items 的 所 有 实例 同样 也 将 消失 。 弱 实体 的 消失 说 明 Line_items 的 主 标 识 
符 (1ineno) 只 有 存在 于 某 个 订单 中 时 才 是 有 意义 的 。 实际 上 ， 这 意 上 时 着 吕 实 体 
Line_items 的 主 标识 符 必 须 包 括 实体 Orders 主 标识 符 中 的 属性 。 像 Line_items 这 样 的 属 
性 叫做 外 标识 符 (external identifier ) 属性 。 

当 琵 实体 Line_items 上 映射 为 一 个 关系 表 ] ine_itrems 时 ， 按 照 转换 规则 4， 一 个 名 为 
ordno 的 列 被 加 入 来 表示 N-1 联 系 has_item; 所 以 表 1ine_items 的 主键 让 外 属性 oradneo 
和 纶 实体 标识 符 1ineno 组 成 。 注 意 ， 有 时 收 区 分 弱 实 体 和 和 多 值 属 性 是 较 困 难 的 。 例如， 在 
例 6.1.2 中 的 hobbies 可 以 看 做 一 个 弱 实 体 Hobbies， 标 识 符 是 hobby_name。 然 而 ， 图 6- 
11 显 然 意味 着 Line_items 拓 一 个 弱 实 体 而 不 是 一 个 多 值 属性 ， 因 为 Line_items 还 单独 联 
系 到 另 一 个 实 恒 Products。 


“一 一 Ep mi 
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3. 泛 北 乓 次 

最 后 ,我们 介绍 活化 后 次 (generalization hierarchy) 或 送 化 联系 { generalization relationship )， 
一 个 对 应 于 对 象 - 关 系 继 了 茜 特 人 性 (在 4.2.3 节 之 前 介绍 ) 的 E-R 概 念 。 其 思想 是 多 个 有 公共 属性 
的 实体 可 以 汉化 为 一 个 珊 高 层次 的 超 业 型 实体 {supertype entity )， 或 者 相反 ， 一 个 一 般 化 实 
体 可 以 分 解 成 低 屋 次 的 子 类 型 实体 ( subtype entity )。 上 月 的 是 让 属性 来 属于 适当 的 层次 ， 以 避 
免 使 用 -个 每 一 个 实例 需 刘 使 用 大 基 空 值 的 公共 实体 的 属性 。 例如， 假 役 我 们 把 Managers 
和 Non_managers 区 别 为 超 类 型 实体 Employees 的 子 类 型 实体 { 见 图 6-12 )。 那 么 像 
expenseno ( 开销 报告 ) 这 样 的 属性 可 以 只 隶属 于 实体 Managers。 而 像 Union_no 这 样 的 
= 上 正 管理 员 属 性 可 以 素 属 于 实体 Non_managers。Consultants 可 以 形成 男 一 个 实体 类 坦 ， 
与 Employees 有 许多 共同 性 质 ， 我 们 可 以 创建 一 个 新 的 超 类 型 实体 Persons 来 包含 二 者 。 
一 个 显示 证 化 层次 的 E-R 图 用 箭头 【不 命名 ) 从 子 类 型 实体 指向 超 类 型 实体 


Persons 


上 
¥endorno Consultants Emp loyYees 
- 1- 
Cexpensend)—| Managers | Nan managers 





图 6-12 附带 属性 的 证 化 层次 例子 


子 类 型 实体 和 起 类 型 实体 之 间 的 箭头 联系 经 常 称 为 [SA 联系， 因为 顾问 (consultant) 是 一 个 
人 {person)， 管 理 人 员 (managen) 是 一 个 雇员 {employse)， 等 等 。 如 同 我 们 在 第 4 章 中 看 到 时 ， 
对 莹 -关系 数据 库 系统 用 类 型 总 承 (type inheritance ) 来 表达 这 些 概念 ， 其 中 一 个 子 类 型 对 象 
( 行 )》 和 包含 特定 属性 但 从 它们 的 超 类 型 那里 继承 所 有 属性 .INEORMIX 和 SQL-99 支 持 对 象 类 
型 的 继 隋 更 多 的 伟 上 县 参见 4.2.3 记 . 

关系 模 弄 没有 为 泛 化 层次 概念 提供 支持 ， 所 以 有 必要 将 这 样 一 个 设计 因素 重新 配置 成 简 
单 的 概念 。 这 个 下 作 可 以 在 转换 到 关系 表 之 前 完成 ， 也 可 以 作为 转换 的 一 部 分 。 在 转换 成 关 
系 表 示 之 前 我 们 给 出 一 种 如 何在 E-R 模 型 防 段 实现 这 一 重新 配置 的 大 法 ， 我 们 每 次 考虑 这 化 
层次 的 一 居 ， 给 出 两 个 可 选择 的 方法 。 

1) 我 们 可 以 将 一 个 单 层 的 子 类 型 和 超 类 卉 实体 间 泛 化 层次 转 成 单个 实体 ， 这 通过 把 子 类 型 
实体 的 属性 加 人 到 超 类 型 实体 中 来 实现 。 一 个 附加 的 属性 必须 如 人 到 这 个 单独 实体 中 ， 它 用 来 
区 别 不 同 的 上 型。 作为 一 个 例子 ， 图 6-12 中 的 实体 Employees 可 以 被 放大 ， 同 时 表 小 管理 员 
和 非 管理 员 ， 这 只 要 在 实体 Employees 中 加 入 属性 union_no、expenseno 和 emptype。 现 
在 ， 当 emptype 有 皮 值 Manager 时 ， 属性 union_no 将 取 空 值 : 类 似 地 ， 当 emptype 取 值 Non- 
Manager 上 时， 属性 expenseno 将 腾空 值 。 属 性 emptype 了 世 可 以 指明 超 类 型 的 情况 ， 当 这 个 超 
类 型 的 实例 不 符合 已 命名 的 任何 一 个 子 类 型 时 ， 这 个 属性 是 一 个 重要 的 替代 。 

2) 我 们 可 以 保留 超 类 型 实体 和 所 有 子 类 型 实体 作为 完全 的 实体 ， 并 创建 显 式 命名 的 联系 
来 表示 这 个 1SA 联 系 。 

当 各 种 子 类 型 实体 和 趣 类 型 实体 的 属性 差异 很 大 并 且 被 应 用 逻辑 按照 不 同方 式 处 理 时 ， 
第 一 个 方法 拖 其 有 十 。 


这 里 ,我 们 设 有 对 实体 -关系 模型 的 所 有 概念 做 完全 深信 的 研究 。 在 本 章 的 末尾 列 出 了 全 
面 研 究 E-R 模 型 和 数据 库 逻 辑 设计 的 参考 文献 ， 有 兴趣 的 读者 可 以 看 - … 看 . 


6.4 案例 学 习 


让 我 们 从 头 实 现 一 个 E-R 语 计 ， 以 生成 最 终 的 一 组 关系 表 为 结束 。 考 虑 -个 简单 的 机 场 订 
暴 数 据 库 系统 ， 这 里 只 处 理 从 一 条 航线 终点 发 出 的 航班 。 我 们 调 要 明 了 旅客 、 航 和 班 、 登 机 口 
和 座 倍 分配 。 现实 中 的 情况 可 能 是 任意 复杂 的 ， 因 为 航班 实际 上 包括 航线 乘务 组 和 避 机 以 及 
地勤 人 员 ， 这 些 要 索 被 组 台 安 排 进 一 张 有 规律 的 起 飞 时 刻 表 中 ， 对 应 不 加 的 口 期 ， 并 有 昌 分 配 
给 这 些 组 合 不 同 的 航班 编号 。 为 简单 起 扣 ， 我 们 很 汰 可 以 用 一 个 实体 Fl1ights 来 代表 这 些 航 
班 ，f1ightnoe 足 它 的 主 椒 识 符 ( 县 有 唯 : 值 ， 即 使 在 以 后 的 日 期 中 也 不 会 再 次 出 现 )， 
aepart_time 是 一 个 描述 属性 ( 实际 上 由 日 期 和 时 间 构 成 ); 其 他 一 些 细节 我 们 者 不 考虑 了 。 
旅客 用 男 一 个 实体 Passengers 起 示 ，ticketnoe 是 主 标识 符 ; 旅客 的 其 他 属性 我 们 者 不 关 
心 。 问 时 ， 我 们 要 明了 一 -次 航 坦 的 座位 情况 。 很 设 在 --… 次 航班 中 ， 个 座位 就 是 一个 实体 洋 
例 ， 对 应 的 实体 是 seats。 用 座位 编号 seatno 区 别 不 同 实例 ， 它 只 在 一 个 特定 的 航班 中 有 效 
( 不同 的 航班 可 能 有 不 同 的 飞机 座位 布局 ， 也 就 有 不 同 的 座位 号 码 集 合 )。 因 此 ， 我 们 把 座位 
分 配 看 司 是 Passengers 和 Seats 之 间 的 联系 ， 命 各 为 seat-assign. 

现在 米 考虑 一 下 这 个 需求 说 明 。 实 人 二 Passengers 容 易 描述 ，F1l1ights 世 是 .Flights 
的 属性 depart_time 是 一 个 复合 属性 ， 尼 由 简单 属性 dt ime 和 ddate 纵 成 .， 我们 可 以 如 入 
另 一 个 实体 Gates， 主 标识 符 是 gat eno。 我 们 已 经 定义 了 - “个 实体 seats，, 但 它 看 起 来 有 
些 奇怪 : Seats 的 主 标识 符 seatno 只 有 与 裤 体 Flighcs 的 一 个 实例 相 联 系 才 有 意义 。 这 就 
是 上 一 节 所 说 的 弱 实 体 ， 因 此 Flights 和 3eats 之 间 必 须 有 一 个 联系 ， 我 们 定 交 为 
has_seat-。 Seats 的 标识 符 中 - -部 分 是 外 部 的 ， 其 中 包 合 班机 的 标识 符 ， 

我 们 还 有 什 和 其 他 联系 呢 ” 如 果 我 们 男 出 到 弄 在 汐止 已 经 命名 的 对 象 的 E-R 图 ， 可 以 注意 
钊 实体 Gates 自 身 是 不 工作 的 。 但 是 非常 清楚 .旅客 要 走 到 一 个 登 机 口 登 机 。 我 们 把 这 建 模 
成 两 个 一 元 联系 而 不 是 一 个 三 元 联系 : 每 个 旅客 与 一 个 特定 的 航班 通过 联系 Passengqers 
travels_on Flights 联 系 起 来 ; 而 登 机 i 通常 作为 多 个 航班 的 编组 点 ( 在 不 同 的 时 间 )， 
这 通过 联系 Gates marshals Flights 表 示 。 图 6-13 显 示 了 这 个 E-R 图 。 从 seatno 到 
Flightno 的 箭头 表示 了 Seats 的 主 标识 符 中 包括 主 实体 Fl1ights 的 标识 符 。 


et 


Flights 和 


图 6-13 简单 航 补 订 票 系统 数 据 库 的 早期 E-R 设 计 
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现在 我 们 需要 算出 联系 中 不 同 参 与 实体 的 基数 。 表 先 考 虑 联系 marshals， 显 然 ， 每 一 个 
航班 只 有 一 个 登 机 门 ， 所 以 card(FE1Lights,marshals)=(ll)。 一 个 登 机 门 可 以 被 志 个 航班 在 不 
则 的 时 间 使 用 ,但 是 没有 规定 一 个 登 机 门 必 须 被 使 用 ， 所 以 cardl(Gates, marshals)=(0,N)。 
项 在 每 一 个 旅客 必须 只 选择 一 个 航班 ， 所 以 card(Passengere,Lravel1s_on=fl,1)。 一 个 航 
址 必然 有 多 个 旅客 才 起 飞 【 如 果 旅 客 太 少 ， 那 么 这 个 航班 将 被 取消 ， 登 机 门 被 重新 分 配 )， 但 是 
数据 库 需 要 掌握 从 没有 旅客 开始 的 信息 ， 所 以 我 们 将 最 小 值 设 为 0， 而 
cardtF1iShts,travels_on)=(0,N)。 一 个 航班 必须 有 很 多 的 座位 提供 给 了 莽 客 ， 所 以 card 
(Flights,has_seats)=(1,N); 并 凸 每 :个 座位 必须 在 唯一 一 个 航班 中 ， 所 以 card(Seats， 
nas seatj=fli)。 每 一 个 旅客 必须 有 且 只 上 朋 一 个 座位 ， 所 以 cardfEassengers，seat 
_assign)={(1,1); 座位 最 多 修一 个 度 客 使 用 和 伯 可 以 空 着 ， 有 所 以 card(Seats,， 
seat_assign) =(0,1)。 标 有 这 些 基数 对 的 E-R 图 显示 在 图 6-14 中 。 





图 6-14 带 肯 基数 的 简单 航空 订 票 数据 库 的 E-R 图 


现在 E-R 设 计 完成 了 ， 我 们 需要 将 它 转换 成 关系 表 。 我们 可 以 从 创建 由 实体 映射 而 成 的 
表 开 始 ， 尽 管 这 意味 着 可 能 忽 噬 一 些 表 示 联 系 外 键 所 需要 的 属性 。 在 我 们 考虑 联系 的 时 候 ， 
骨 来 向 这 些 表 中 加 入 局 性 。 我 们 首先 注意 到 实体 Fl1ights 在 关系 甫 中 没有 多 值 属性 ， 所 以 
按照 转换 规则 1， 我 们 加 入 ddate 和 dtime 列 到 表 f1lights 中 , 除了 冯 seats， 有 映射 其 他 
表 都 很 容易 。seats 只 是 简单 的 一 列 seatnco， 尽 管 这 不 是 该 表 的 一 个 完整 的 键 ， 所 创建 的 
表 如 下 : 


passengers gates flights spats 


现在 考 虚 联 系 has_seat， 在 图 6-14 中 它 是 N-1 的 ，Seats 是 “多 ” 方 。 按照 转换 规则 4， 
去 seats 的 一 个 外 键 把 每 一 个 seats 的 行 联系 到 适当 的 f1ights 的 行 。 这 构成 了 表 seats 的 
主键 ， 它 代表 了 一 -个 弱 实 体 ， 所 以 篆 要 一 个 外 键 来 标识 每 一 行 。 





bassengers gates fiights seats 
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passengers yates 





fiights seats 


联系 seat_assign 昆 1-1 的 ，Seats 是 可 选 参与 方 。 按 照 转 换 规 则 5， 我 们 可 以 通过 在 表 
passengers 中 加 入 seats 的 一 个 外 键 (需要 添加 两 刚 ) 来 表示 这 一 点 。 我 们 不 期 望 将 来 为 
了 一 个 给 定 座位 还 要 查看 对 应 的 旅客 ， 所 以 没有 在 表 seats 咎 附加 外 键 。 站 划 表 定义 如 下 。 

现在 考 虚 联系 marshals,， 这 是 - -个 N-1 了 联系， Flights 是 “ 淘 ” 方 ， 所 以 按照 规则 4， 
表 f1ights 中 的 -个 外 键 gareno 将 连接 每 一 个 EL1ghts 行 到 相应 的 gaLes 行 : 


人 D5 人 人 NYT gates 





fiights seats 





类 似 地 ， 联 系 tLravels_on 是 N-1 的 ，Passengers 是 “多 ” 方 。 所 以 护照 转换 规则 4 肯 
passengers 的 一 个 证 键 f1ightno 将 连接 每 一 个 bassengers 行 人 到 相应 的 fl1ights1j,， 然 
而 ， 这 个 列 口 经 在 passengers 表 中 存在 了 ， 所 以 关系 表 设 计 到 此 大 功 告 成 . 


6.5 规范 化 : 基础 知识 


规范 化 是 关系 数据 库 罗 和 辑 设 计 的 另 一 种 方法 ， 它 和 E-R 模 型 不 太 相 似 ， 但 是， 一 个 基于 规 
范 化 的 关系 设计 和 一 个 由 E-R 设 计 转 换 成 的 关系 设计 几乎 得 到 相同 的 结果 。 而 且 尝 实 上 ， 两 种 
方法 具有 互补 性 。 在 规范 化 方法 中 ， 设 计 者 从 一 个 将 被 建 模 的 现实 世界 的 情形 出 发 ， 列 出 将 
成 为 关系 表 中 列 名 的 候选 数据 项 ， 以 及 这 些 数据 项 之 间 关 系 的 规则 列表 。 这 样 做 的 自 标 是 将 
所 有 这 些 数据 项 表示 成 为 符合 限制 条 件 的 表 的 属性 ， 这 些 限 制 条 件 与 我 们 所 称 的 范式 相关 。 
这 些 范式 定义 限制 着 表 可 以 接受 的 形式 ， 使 它 具 有 所 期 望 的 特定 性质 ， 并 旦 避免 各 种 各 样 的 
异常 行为 。 日 前 存在 一 系列 的 范式 定义 ， 它 们 一 个 比 一 个 限制 得 更 此 格 。 相 章 所 讲述 的 范式 
有 第 一 范式 (INF)、 第 一 范式 (2NF )、 第 三 范式 (3NF ) 和 Boyce-Codd 范 式 【BCNF )。 其 
他 类 型 的 范式 ，4NF 和 5NF， 没有 在 本 书 中 详 述 。 

首先 ， 符合 第 一 范式 ( 1NF ) 的 表 就 是 没有 多 值 字段 的 表 ， 世 就 是 : -个 遵循 2.3 节 中 关系 
规则 1 《第 一 范式 规则 ) 的 表 。 我 们 在 第 2 章 和 第 3 章 中 学 当 的 关系 模型 和 和 SQL 语言 把 这 一 规则 
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作为 基本 规 旭 ,但 是 第 4 章 中 介绍 的 对 象 -关系 系统 在 两 个 方面 有 所 人 不同: 允许 复合 类 型 和 汇 
集 类 塌 的 值 出 现在 列 中 。 以 让 除非 特别 指明 ， 我 们 总 起 设 表 是 符合 1 NF 的 。 第 二 范式 (2NF ) 
下 起 来 像 是 过 时 的 东西 ， 内 为 没有 哪个 明智 的 设计 人 员 会 把 数据 库 设 计 成 2NF 的 ， 他 总 是 会 
继续 规范 化 直到 符合 更 严格 的 3NF。 从 一 个 将 所 有 数据 项 包含 在 一 个 表 ( 石 时 称 为 全 局 表 ) 
中 的 初 馈 数据 库 以 及 这 些 数 据 项 的 相关 性 规则 出 发 ， 可 以 冲 过 一 定 的 过程 创建 一 个 共有 多 个 
表 的 等 价 数据 库 ， 这 些 表 均 符合 第 . :范式 。( 这 是 我 们 所 说 一 个 3NF 数 据 库 的 含义 一 一 数据 详 
中 所 有 表 玫 上 其 有 3NF 的 形式 - ) 当 我 们 进行 到 本 章 结束 时 ， 就 会 发 现任 何不 符合 第 三 范式 的 表 
部 能 够 分 和 解 为 几 个 不 同 的 表 ， 并 有 具有 以 下 性 奈 ， 第 一 ， 侍 一 个 分 解 出 的 表 都 是 一 个 有 将 的 第 
三 范式 表 ， 第 一 ， 所 有 分 解 出 的 表 的 联接 恰恰 包含 原始 硼 的 信息 ， 从 原始 全 局 表 分 解 出 的 
3NF 表 集合 被 称 为 数据 库 的 一 个 3NF 无 损 分 解 。 

我 们 还 可 以 在 3NF 分 解 中 提供 第 三 个 性 质 。 当 向 3NF 分 解 中 的 一 个 表 添 加 一 行 (或 者 更 新 
一 行 ) 时 ， 林 能 有 - :个 错误 的 更 新 打 酸 数据 项 相关 性 规则 ， 这 些 规 则 是 先 及 数据库 设 计时 输 
入 的 一 部 分 。 我 们 希望 对 插入 和 更 新 操作 施加 一 个 限制 ， 以 使 这 些 错 误 不 会 破坏 数据 ,那么 ， 
在 分 解 中 的 第 三 个 重要 性 质 足 当 对 一 个 表 做 插 人 或 者 更 新 操作 有 时， 通过 验证 被 作用 的 表 中 数 
据 项 的 有 效 性 ， 可 以 检查 是 可 破坏 了 相关 性 规则 ， 向 不 必 进 行走 的 连接 操作 。 具 有 刚 提 到 的 
个 期 望 性 质 的 3NE 分 解 通 常 被 认为 是 叮 以 接受 的 数 撕 库 设 计 - 可 以 看 出 进 : 步 将 3NE 分 解 
为 更 严格 的 BCNF 通 党 是 没有 必要 的 【现实 中 的 很 罗 3NF 数 据 库 同 时 也 是 BCNEF 的 )。 但 是 如 
果 进 行 了 进一步 的 分 解 . 那么 分 解 结果 中 将 不 再 保证 第 三 个 性 质 成 立 ， 因 此 很 多 数据 库 设 计 
人 员 决 定 使 用 3NF 设 计 。 

在 能 够 恰当 地 处 理 这 些 想 法 之 前 ， 我 们 宽 要 对 规范 化 方法 的 细节 做 史 包 深入 了 解 。 让 我 
们 用 一 个 例子 开始 说 明 。 


1. 一 个 实际 运行 中 的 出 子 : 礁 员 信息 emp id 
我 们 需要 用 一 个 例子 米 洪 清 以 后 一 些 数据 库 设计 。 | erp-name 
涉及 的 定义 。 考 虑 图 6-15 中 列 出 的 数据 项 ， 他 们 代表 | 


了 一 个 大 公司 人 事 部 门 必 须 建 模 的 雇 员 信 息 。 dept phone 

以 emp__ 开 头 的 数据 项 表示 我 们 在 E-R 方 法 中 所 说 dept_mgrname 
的 实体 Employees 的 属性 。 存 在 于 图 6-15 中 其 他 数据 | 
项 下 的 实体 包括 Departments (表示 座 员 在 公司 中 skill date 
所 属 的 部 门 】 和 Ski1lls {表示 各 种 雇员 为 进行 他 们 sgi11_1Y1 
的 工作 所 需 具 备 的 技能 )。 在 规范 化 方法 中 ， 我 们 被 
有 给 实体 概念 命名 ， 而 在 数据 项 相关 性 规则 中 反映 出 。 四 从 宫 信 的 寄 吕 信息 数 汉 区 
它 ， 这 些 相 关 人 性 规则 就 是 所 谓 的 函数 依赖 ， 我 们 在 稍 后 解释 。 建 立 效 据 项 emp_id 用 来 唯一 标 
识 和 雇员。 每 一 个 雇员 为 公司 里 基 个 部 门 工 作 ， 以 daept_ 开 头 的 数据 项 描述 了 不 同 的 部 门 ， 数 
据 项 aept_name 唯 一 标识 部 门 ， 每 一 个 部 门 通常 有 唯一 一 个 的 经 理 {也 是 一 个 雇员 )， 它 的 
名 字 在 aept_mgrname 中 给 出 。 最 后 ， 我 们 假设 各 种 雇员 各 自 握 有 一 些 技能 ， 例 如 打字 或 者 
文件 编排 。 以 skid41_ 开 买 的 数据 项 描述 了 技能 ， 公 司 根据 这 些 技能 来 考核 亡 员 、 分 配 工作 和 
划 定 薪水 。 数 据 项 ski11_ia 唯 一 标识 了 一 种 技能 ， 该 技能 还 有 - -个 名 字 skil11_name。 对 
于 一 个 所 有 特定 技能 的 和 雇员，skil1l_date 描 述 了 这 个 技能 最 后 -次 被 考核 的 日 期 ， 


从 一 个 到 友和 是 的 技 
能 可 用 于 - -个 公司 





第 6 时 和 据 床 奏 太 257 


ski11_lvl1 描 述 了 雇员 在 考核 中 获得 的 技能 等 级 。 

图 6-16 提 供 了 一 个 通用 表 emp_info， 它 包含 了 图 6-15 中 雇员 信息 的 所 有 数据 项 。 按 照 第 
一 范式 。 表 中 的 每 一 个 每 一 行 的 每 一 列 中 愉 能 有 原子 值 。 这 造成 : -个 难题 ， 因 为 每 个 雇员 可 
能 有 许多 技能 。 如 我 们 在 2.3 节 中 讨论 的 ， 设计 一 个 表 ， 其 中 的 行 由 emp_igd 唯 一 决定 ， 并 为 
每 一 种 技能 信息 设计 一 列 ， 这 样 居 是 不 恰当 的 ~ 一 六 为 我 们 甚至 林 知 道 一 个 雇员 技能 的 最 大 
数目 ， 所 以 我 们 不 知道 需要 用 多 少 列 来 表示 所 有 技能 。 在 单独 -- 个 {通用}) 表 中 解决 这 个 问 
古 的 唯一 可 行 方 法 是 ， 放 弃 一 个 雇员 对 应 唯一 一 行 的 方法 ， 而 复制 雇员 上 炳 息 ， 在 不 同 的 行 中 
将 该 雇员 和 不 同 技能 进行 配对 。 


emp_info 


Ta me oe i | 
|i | le i om Ti 
oa ome | Ni remm [om [io 
mai | | pe [orsm | 
Ts | rm [or |s 


a am | | was |wa | 7 


| 


图 6.16 单个 雇员 信息 表 emp_infce， 满 足 第 一 范式 


对 于 图 616 中 smp_info 才 ， 数 据 库 设 计 人 员 的 设计 意 工 是 公司 中 存在 的 每 一 个 雇员 - 技 
能 对 都 在 表 中 册 有 一 行 。 从 这 一 点 可 以 清楚 地 看 到 ， 不 存在 某 两 行 在 属性 emp_id 和 和 
skill..igq 上 具有 相同 的 值 。 我 们 在 定义 2.4.1 中 定义 表 的 键 时 已 经 介绍 了 描述 这 一 情形 的 术 
语 。 我 们 户 明 表 emp_info 有 一 个 (候选 ) 键 ， 即 属性 emp_iqd skill_igd 组 成 的 集合 。 回 
忆 前 面 表示 一 个 属性 集 的 简单 方法 : 将 属性 列 出 ， 中 间 用 空格 分 离 。 道 过 确认 在 表 中 这 些 属 
性 到 的 值 可 以 区 别 任 意 两 行 (也 就 是 说 ， 对 任何 行 4 和 v， 要 么 wu(emp_id)v(lemp_id)， 要 么 
askill_id) 闫 wski11.ig))， 我 们 可 以 确信 这 些 属性 构成 广 一 个 键 ， 并且 不 存在 该 属性 
集合 的 子 集 具 有 相同 的 性 质 〔 即 能 够 有 两 行 w 和 vw 满足 emp_id)=v(emp_iqd)， 并 且 有 两 行 和 
s 也 满足 rx(ski11 _ id)=s(skil11_id))。 后 面 ， 我 们 假设 emp_iqd ski11._iqd 是 表 emp_info 
的 主键 。 

图 6-16 的 数据 库 设计 看 起 来 很 粮 ， 因 为 在 使 用 数据 控制 语句 更 新 这 个 表 时 ， 它 存在 某 些 
会 毁坏 数据 的 异常 。 

2. 不 良 数 据 库 设计 中 的 异常 

在 图 6-16 中 表 emp.info 可 能 会 出 现 问题 ， 因 为 座 员 数据 在 不 同 的 行 中 重复 。 按 照 我 们 日 
前 已 有 的 经 验 ， 便 每 一 个 不 同 的 雇员 有 唯一 一 行 伏 乎 种 自然 。 有 什么 理由 来 支持 我 们 的 感觉 
呢 ? 让 我 们 看 看 应 用 SQL 更 新 语句 时 ， 这 个 表 的 行为 。 

假如 某 个 雇员 将 获得 一 个 新 电话 号 码 ， 我 们 就 不 得 不 更 新 很 多 行 〈 那 个 雇员 的 所 有 包含 
不 闻 技 能 的 行 ) 以 使 用 统一 的 方法 更 改 emp_phone 值 。 如 果 我 们 只 更 新 一 行 中 的 电话 号 码 ， 
使 得 该 诸 员 的 一 些 行 具有 和 其 他 行 不 同 的 电话 号 码 ， 那 么 就 可 能 毁坏 数据 。 这 就 是 通常 所 说 
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的 更 新 异常 。 它 是 因为 数据 兄 余 而 产后 的 ， 即 emp_info 中 雇员 电 活 叶 码 和 其 他 -~: 些 雇员 属 
性 在 多 个 行 |: 重 复 。 把 它 叫 司 “异常 "， 暗 示 着 它 是 更 新 时 的 不 规则 行为 。 可 能 这 有 点 极端 ， 
因为 SQL 场 言 具备 一 次 性 更 新 多 行 的 能 万 ， 这 只 要 使 用 如 下 的 一 个 查找 更 新 语句 就 可 以 完成 : 

Update emp_info set emp phone = :newphone where enmp Id = :eeidval: 

事实 上 ， 多 行将 被 更 新 的 考虑 在 这 个 语法 中 并 不 明显 ， 如 果 每 一 个 emp_idq 值 都 只 有 唯一 
一 个 行 与 之 对 应 的 话 ， 将 使 用 相同 的 查找 更 新 语句 。 然 而 ， 由 于 在 不 同行 中 电话 号 码 的 重复 ， 
在 一 个 定位 更 新 语句 中 仍然 会 发 生 问 题 。 如 果 我 们 从 一 个 为 了 完全 不 同 的 日 的 创建 的 游标 中 
提取 表 emp_info 的 行 。 程 序 可 能 执行 下 面 的 语句 来 允许 用 户 更 正 一 个 盛 效 的 电 语 号 码 : 

uprate emp. info set emp_phone = :newphone 

where current of tursor_name: 


这 将 成 为 一 个 编程 错误 ， 因 为 一 个 有 经 验 的 程序 员 会 意识 到 改变 - -个 亡 员 的 电话 号 码 需 
要 更 新 多 行 。 但 这 仍然 是 一 种 在 实践 中 非常 容易 出 现 的 错误 ,我 们 希望 能 够 在 表 上 建立 一 个 
约束 使 这 样 的 错误 更 新 不 会 发 生 。 看 起 洲 提 供 这 一 约束 的 最 好 方法 是 重新 分 配 数据 项 到 不 同 
的 表 中 ， 以 消除 信息 的 重复 存放 。 这 怡 是 规范 化 过 程 将 实现 的 任务 。 我 们 用 一 个 定义 总 结 更 
新 异常 ， 定 义 中 参考 了 我 们 对 于 E-R 模 型 的 直观 理解 。 


定义 6.5.1 更 新 异常 【Update Anomaly ) 如果 更 改 表 所 对 应 的 某 个 实体 实例 或 者 关系 
实例 的 单个 属性 时 ， 和 需要 将 多 行 更 新 ， 那 么 就 说 这 个 表 存 在 更 新 异常 。 再 
坟 一 种 问题 ， 称 泡 删 除 异 常 ， 用 下 面 定 义 反 有 上映 。 


定义 6.5.2 删除 异常 ( Delete Anomaly )、 拉 入 异常 ( Insert Anomaly ) ”如果 删除 表 的 
茶 一 行 来 反映 某 个 实体 实例 或 者 关系 实例 消失 时 ， 人 金 导 致 天 和 失 员 一 个 不 同 实体 实例 或 考 关 系 
实例 的 信息 ， 而 这 是 我 们 不 希望 丢失 的 ， 那么 台 说 这 个 表 存 在 删除 异常 。 宪 入 异常 星 这 个 间 
题 在 插 人 方面 的 表现 ， 其 中 我 们 无 法 在 缺少 男 一 个 实体 实例 或 关系 实例 的 情况 下 ， 表 示 某 个 
实体 或 者 实例 的 信息 。 | 


例如 ， 假 说 一 个 雇员 拥有 的 一 个 技能 必须 在 五 年 后 重新 被 考核 。 如 果 雇 员 没 能 够 通过 技 
能 再 测试 【 ski1l1_date 列 被 更 新 )， 那 么 技能 将 从 emp_imnfo 列 表 中 除去 《一 个 自动 过 程 删 
除 具 有 这 一 emp_id 和 和 ski1l1l_id 的 行 )。 现 在 考虑 如 果 具 有 图 6-16 中 那些 列 的 emp_info 表 
中 ， 某 个 雇员 的 技能 数目 减少 为 零 ， 会 发 生 的 事情 : 没有 任何 有 关 这 个 雇员 的 行 会 镜 下 来 ! 
因为 这 个 删除 操作 ， 我 们 丢失 了 这 个 雇员 的 电话 号 码 和 所 在 部 门 ! 这 显然 是 不 恰当 的 设计 。 
定义 6.5.2 的 另 -个 异常 , 搬入 异常 在 表 emp_.info 表 中 存在 ， 办 为 除非 这 个 雇员 已 经 获得 
某 种 技能 ， 否 则 我 们 不 能 输入 一 个 新 的 雇员 到 表 中 ， 因 此 雇 仙 一 个 实习 生 是 不 可 能 的 。 很 明 
癌 ， 这 是 删除 异常 的 男 一 面 ， 在 删除 异常 中 ， 当 一 个 雇员 失去 他 (或 她 )} 的 最 后 一 种 技能 时 ， 
关于 这 个 雇员 的 信息 便 会 丢失 。 

现在 网 到 对 付 到 现在 为 止 提出 的 问题 的 解决 方法 。 我 们 简单 地 将 表 emp_info 分 解 成 两 
个 表 ， 表 emps 和 表 skil11ls， 表 的 列 名 在 图 6-17 中 列 出 。 注 意 ， 表 emps 对 每 一 个 emp_ ia 
{emp_id 是 这 个 表 的 键 } 有 唯一 的 行 ， 同 时 表 ski11s 对 每 一 个 emp_iq skil1 aq 属性 对 
有 唯一 的 行 ， 这 个 属性 对 形成 了 该 表 的 键 。 因 为 与 每 一 个 麻 员 相关 的 技能 有 多 个 ， 有 所 以 加 入 
到 表 skil1s 中 的 emp_ia 列 扮演 了 外 键 的 角色 ， 它 将 技能 联系 回 employees。 当 我 们 计算 
这 两 个 表 的 自然 连接 时 ， 结 果 怡 恰 是 开始 时 的 表 emp_info。 (我 们 将 在 后 面 论证 这 一 事实 ， 
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但 是 现在 你 可 以 确信 这 一 点 。} 现在 ， 删 除 蜡 党 不 skills | 
再 是 :- “个 问题 。 如 果 我 们 删除 与 任何 一 个 座 员 的 emp_id emp id 
技能 相关 的 所 有 行 ， 仅 仅 会 删除 表 ski1l11s 中 的 emp_name skil]_id 
行 ; 表 emps 中 消 然 包含 我 们 想 保 留 的 该 寥 员 的 信 emp_phone ski11. name 


skill date 


息 ， 例 如 emp_phone、dept_name 等 等。 dept_name 
在 后 面 的 小 节 中 ， 我 们 将 学 习 符 样 进 行规 范 dept. phone skKil11_1V1 

化 ， 来 分 解 表 以 克服 上 所 有 的 异常 。 图 6-17 中 的 表 还 dept_mgrname 

没有 达到 这 一 要 求 ， 稍 后 我 们 将 看 到 在 其 中 还 有 图 6-47 只 有 两 个 表 的 emm_info 数 据 库 

很 多 异常 存在 。 在 我 们 能 够 适当 处 理 基 本 规范 化 

概念 之 前 ， 痪 要 对 规范 化 方 法 的 细 贡 仔细 人 镀 究 。 下 面 ， 我 们 给 出 基于 数据 库 规 范 化 的 :一些 糙 

要 的 基本 数学 概念 。 因 为 并 不 总 是 能 够 找到 一 个 现实 生活 中 的 实例 来 前 明 所 有 这 些 概念 ， 所 

以 我 们 请 读 考 耐心 一 点 。 到 最 后 ， 这 些 概念 的 价值 就 会 体现 出 来 。 


6.6 函数 依赖 


了 消 数 依赖 (FD ) 定义 了 数据 库 系统 中 数据 项 之 间 相 关 性 性 质 中 最 常见 的 类 型 。 我 们 通常 
只 需 考 虑 单个 关系 表 的 属性 列 之 间 的 相关 性 ， 定 六 中 反映 了 这 一 点 。 我 们 用 r,，r;，… 来 表示 
表 T 的 行 ， 同 时 按照 标准 惯例 使 用 表 的 属性 这 个 术语 ， 而 不 是 列 。 一 个 表 的 单个 属性 将 用 A， 
B，… 来 表示 ， 用 字母 XX，Y，…- 来 表示 属性 的 子 集 。 我 们 按照 第 2 章 中 的 概念 ， 用 r(A) 表 示 行 
[的 属性 A 的 值 。 

定义 6.6.1 给 定 一 个 包含 至 少 两 个 属性 A 和 B 的 表 T， 我 们 说 A 一 B ( 读 做 “A 函 数 决定 B” 
或 者 “B 函 数 依赖 于 A”)， 当 且 私 当 设 计 者 希望 对 于 表 T 的 任何 可 能 的 内 容 ! 行 集合 )，T 中 的 
两 行 不 能 在 A 上 取 相 间 值 面 在 B 上 取 不 同 值 。 一 个 更 形式 化 的 说 法 是 : 给 定 T 的 两 行 r, 和 r,， 如 
果 r(A)=rfal)， 那 么 r(B)=m(B)。 后 面 一 般 使 用 前 一 各 表述。 | 

从 数学 角度 看 ， 定 义 6.6.1 可 以 和 男 数 的 定义 相 比 : 对 于 属性 A 的 每 一 个 元 素 【 它 将 出 现在 
某 行 中 )， 8B 中 有 唯一 一 个 元 素 ( 出 现在 某 一 行 中 ) 与 之 对 应 。 参 见 医 6-18 中 国 数 依 赖 概念 的 
图 示 。 





二 


A 中 
A 画 数 决 定 B，A 的 每 个 值 对 应 B 的 唯一 个 值 。 上 下 男 数 决定 BE，A 的 号 些 值 与 B 的 专 于 -… 个 值 相对 庶 。 


图 6-18 函数 依 藉 的 图 形 描述 
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例 6.6.1 在 图 6-16 的 表 emp_info 中 ， 有 下 面 一 些 函 数 依 至 成 立 ; 


emp_id — Emp. Name 
emp_id 一 > emp. phorne 


emp_ id = dept_name 


任 E-R 概 念 中 ， 我 们 知道 这 些 是 成 立 的 ， 因 为 emp._i3 是 实体 Employee 的 一 个 标识 符 ， 
其 他 数据 项 简单 地 表示 了 实体 的 其 他 属性 。 一 旦 一 个 实体 被 确定 ， 它 的 所 有 其 他 属性 也 就 确 
定 了 。 人 了 但 是 我 们 也 可 以 攒 直觉 辨识 这 一 事实 。 如 果 我 们 看 到 在 图 6-16 的 表 emp_intoe 的 二 计 
中 ， 有 疯 行 具有 相同 的 emp_id 信 和 和 不同 的 emp_phone 值 ， 我 们 就 认为 这 些 数 据 被 破 十 了 
( 假说 每 一 个 雇员 有 唯一 一 个 电话 },， 但 是 如 果 我 们 看 到 两 行 有 相间 的 emp_phone 值 和 不 同 的 
emb_idqd 值 ， 我 们 的 第 一 个 想法 是 它们 代表 了 不 同 的 雇员 ， 这 两 个 雇员 共用 一 个 电话 。 查 是 这 
两 个 情形 是 对 称 的 ， 这 完全 是 由 于 我 们 对 于 数据 的 简单 理解 寻 至 我们 认为 第 一 种 情形 是 被 破 
坏 的 数据 。 我 们 指望 用 emb_id 打 破 这 一 束缚 ， 来 唯一 地 标识 雇员 。 注 意 我 们 所 说 的 暗示 羞 
emp_id 晃 数 决 定 emp_phone 而 emp_phone 并 没有 隔 数 决定 emp _id。 有 了 时候 用 下 面 形式 表 
示 司 面 这 一 版 ; 

emp _ Phonea PD emp_id 加 

例 6.6.2 ”这 里 用 三 个 表 来 研究 属性 间 孙 数 依 赖 ‘注意 ， 有 的 表 违 反 了 关系 规则 3， 也 就 是 
行 唯一 规则 ， 众 是 为 了 演示 我 们 认为 它们 是 有 效 的 表 )。 在 这 些 表 中 我 们 假设 设计 者 的 意图 是 
有 私有 这 些 行 出 现在 表 中 一 一 不 会 发 生 对 表 的 更 改 。 所 以 我 们 可 以 道 过 检查 数据 来 发 现存 
在 什么 盟 数 依赖 。 通 常 我 们 通过 体会 数据 项 和 企业 运作 的 者 则 来 决定 函数 依赖 《例如 ，- 一 个 
雇员 只 有 一 个 电话 号 码 ， 雇 员 们 可 以 共用 一 个 电话 ， 等 等 )， 如 例 6.6.1 中 所 示 。 这 些 规则 在 任 
何 数 据 被 加 和 到 表 中 之 前 束 已 存在 。 








革 tm 上 一 


在 表 T1 中 ， 我 们 很 容易 看 到 A 一 B; 我 们 仅仅 需要 检查 每 一 个 行 六 和 产 组 成 的 对 ， 如 果 
raA)=rmA) 那 么 mnOB)=m(B)。 热 而 ， 在 表 Ti 中 没有 行 对 在 列 A 上 具有 相同 的 值 . 所 以 条 件 害 平 
几 地 满足 。 同 时 在 表 Ti1 中 ，B 六 A【 读 做 :“ 列 B 不 熙 数 决 定 列 A”)， 因 为 ， 如 果 六 是 行 1 ，r: 
是 行 3， 那 么 rn(B)= r, (B)=y1， 但 是 rm (A)=xLI 关 r (A)=x3。 在 表 T2 中 ， 我 们 有 A-*B( 我 们 只 需 
要 检查 行 1 和 行 3， 它 们 有 具有 相同 的 A 值 也 有 相同 的 B 值 ， 同 样 栓 查 行 2 和 行 5) 和 B 一 A。 最 后 ， 
在 表 T3 中 ，A 一 B 但 是 BE -A 如果, 是 行 2>，r 是 行 6， 那么 r,(B)= rx; (B)=y4， 但 是 1 (A)=x2 
r, (A)=x4 )。 县 


和 如何 将 函数 依赖 的 定义 扩展 成 完整 的 一 般 形式 以 处 理 属 性 集 是 显而易见 的 。 


- Er 
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定义 6.6.2 ”给 定 表 T 和 两 个 属性 集 ， 分 别 为 和 =A AAA 和 Y=BIB:B,， 愉 的 一 些 属 性 可 
以 与 了 的 一 些 属性 重 委 。 我 们 说 和 一 Y( 读 做 “X 函数 决定 Y” 或 者 “Y 郴 数 依赖 于 和 ”)， 当 且 
仅 当 设计 者 的 意图 是 对 于 表 中 可 能 存在 的 任何 行 的 集合 ，T 中 琴行 不 能 在 X 的 属性 上 相同 ， 而 
同时 在 Y 的 属性 取 不 同 值 。 注 意 到 两 行 在 X 的 属性 上 相同 是 指 它们 在 X 的 所 有 属性 上 取 相 同 值 ， 
而 它们 在 Y 的 属性 上 不 相同 是 指 在 Y 的 任意 一 个 属性 上 地 值 不 同 。 更 为 形式 化 的 表述 是 ， 给 定 
T 的 两 行 5 和 mm， 如 果 m (AJ)= T: (A) 对 每 一 个 关中 的 A 成 立 ， 那么 n(B)-=ngB) 对 于 Y 中 的 每 一 个 B， 
成 立 。 图 


例 6.6.3 ”我 们 在 此 列 出 图 6-16 中 为 表 emp_info 定 义 的 所 有 郴 数 依赖 (FD ) (没有 图 6-15 
中 的 属性 )。 根 据 这 个 FD 列 表 ， 规 范 化 过 程 需要 的 所 有 信息 就 有 了 -. 

{1} emp id 一 emp_name emp_phone dept_name 

12) dept name — dept_phone dept_mgrname 


13) skill_id — sk111_name 
14) emp_id skill_id — skill_date skT11 _1vl 


你 应 当 能 够 解释 每 一 个 函数 依 束 ， 肝 看 你 是 否 同 意 它 们 。 例 如 ，FD(1) 说 明 如 上 抹 我 们 知道 
emp_iqd， 那 么 emp_name、emp_phone 和 dept_name 就 被 确定 下 来 了 注意 FD(1) 怡 怡 是 
例 6.6.1 中 函数 依赖 的 男 一 种 表述 方法 ， 也 就 是 说 如 果 我 们 知道 下 面 的 函数 依赖 成 立 ，; 

emp_id — emp name, emp_id 一 emp_phone, and emp_ id 一 dept_name, 

那么 就 可 以 说 FD(1) 成 立 。 

挽 一 种 说 法 ， 例 5.6.1 的 三 个 FD 共同 导出 了 FD(1)。 同 样 ， 从 FD(1) 我 们 可 以 得 出 结论 : 例 
6.6.1 的 沽 个 FD 成 立 。 可 以 使 用 一 个 简单 的 FD 推导 规则 得 出 这 些 结论 ， 这 个 规则 是 基于 隔 数 依 
赖 定义 的 ， 我 们 将 在 尹 后 学 习 更 多 有 关 这 种 规则 的 知识 。 

因为 FD(1) 到 (4) 全 是 表 emp_info 的 函数 依赖 ， 所 以 我 们 可 以 推断 ， 设 计 者 并 不 希望 
skil1_name 对 于 特定 技能 是 唯一 的 。 因 为 ski11_id 是 技能 的 唯一 标识 符 。 如 果 认 为 
skill name 是 唯一 的 ,那么 就 意味 着 ski11 name- ski1l1_igd， 即 FD(3) 的 反 向 。 然 向 ， 
这 个 FD 在 集合 中 并 不 存在 ， 更 不 用 说 它 是 可 以 被 推导 出 的 。{ 看 它 是 否 可 被 推导 的 一 个 快速 
测试 是 ， 注 意 ski11_name 没 有 在 任何 集合 中 的 FD 的 左边 出 现 。) 我 们 也 注意 到 设 有 因数 依 
赖 aept_mgrname 一 daept_name， 这 条 函数 依赖 意味 着 虽然 每 一 个 部 门 有 唯 - -的 经 理 ， 但 
是 - -个 经 理 可 以 同时 管理 一 个 以 上 的 部 门 。 最 后 注意 ，ski11_1lv1 和 skil1_date 只 有 作为 
实体 Emp1l1oyee 和 Ski1l 之 间 联 系 的 属性 时 才 是 有 意义 的 。 如 果 我 们 说 一 个 给 定 的 麻 员 的 某 
个 技能 的 水 平 是 9， 那 就 有 必要 问 :“ 指 的 是 和 什么 技能 ?”; 如 果 说 知道 有 一 个 “打字 ”的 技 
能 水 平 是 9， 我 们 就 可 能 想 知 道 :“ 指 的 是 哪 类 雇员 ? ”所 以 我 们 需要 命名 emp_ia 和 
skil11_ ia 来 决定 这 些 属性 。 本 

1. 了 光孝 依赖 的 还 辑 益 涵 

在 例 6.6.3 中 许多 结论 的 得 出 都 依赖 于 理解 函数 依赖 之 间 的 歼 池 关系 。 接 下 来 ， 我 们 将 从 
定 多 6.6.2 中 喜 接 得 出 一 些 时 数 依赖 中 的 草 削 规则。 读者 需要 在 严格 的 和 和 直觉 的 两 个 层次 上 埋 
解 很 多 这 种 规则 ， 才 能 够 正确 理解 稍 后 章节 中 介绍 的 一 些 规范 化 技术 。 我 们 从 一 个 非常 基本 
的 规则 开始 。 

定理 6.6.3 ”包含 规则 { Inclusion Rule) 给 定 表 T， 其 标题 是 Head(T) { 是 一 个 属性 集 ， 
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如 同 2.2 节 中 定义 的 )。 如 果 扩 和 Y 是 Head( 了 T) 中 属性 的 集合 ， 并 且 YC 己 多， 那么 XX 一 YY。 

证 ”我 们 运用 定义 6.6.2。 为 了 说 明 X 一 Y， 只 需要 证 明 没 有 两 行 4= 和 v， 它 们 在 X 的 属性 上 
取 相 同 值 ， 俐 同时 在 Y 的 属性 上 取 不 同 值 。 这 是 显而易见 和 的， 因为 两 行 不 可 能 在 X 的 属性 上 取 
相同 值 而 同时 在 这 些 属性 的 某 个 子 集 上 取 不 同 值 ， 加 

这 个 包 会 规则 为 我 们 提供 了 非 这 多 的 函数 依赖 ， 这 些 函 数 依赖 对 于 任何 属性 构成 的 表 都 
是 成 立 的 ， 而 不 论 打 算 放 入 其 中 的 内 容 是 什么 。 

定义 6.6.4 ”平凡 恢 束 {Trivial Dependency 】  ” 表 T 中 的 一 个 平 几 依 琼 是 一 个 形 如 X 一 Y 
的 函数 依赖 ， 其 中 基站 YE 所 Head(T)， 是 对 于 表 T 的 任何 可 能 的 内 容 都 成 立 。 国 

我 们 可 以 证 明 平 凡 依 赖 是 从 包含 规则 产生 的 。 

定理 6.6.5 给 定 表 T 的 一 个 平凡 依 巾 X 一 Y， 必 然 有 YC 入 义 。 

证 给 定 表 T， 其 标题 行 包 含 XUY 中 的 属性 ， 考虑 属性 集 Y -XX ( 存 企 于 Y 而 不 在 X 中 的 属 
性 )。 因 为 X 一 了 是 一 个 平凡 依 不 ， 所 以 它 对 表 工 的 任何 内 容 必然 都 成 立 。 我 们 假设 Y- X 非 空 ， 
以 推出 一 个 矛盾 。 如 果 集 人 台 立 - X 非 空 ， 令 A 是 立 - 和 中 的 一 个 属性 。 因 为 A 基 和 ,那么 可 以 和 桩 
表 T 中 构造 两 行 xs 和 vv， 它 们 在 X 的 属性 上 取 值 相同 ， 但 是 在 & 上 取 俏 不 相同 。 然 而 表 T 有 这 样 两 
行 ， 函 数 依 赖 X 一 人 恒 不 再 成 立 ， 因 为 行 w 和 vv 在 X 的 属性 上 取 相 同 值 而 在 Y 的 属 人 性 上 取 不 同 值 
(AsY) 既然 一 个 平凡 依赖 必须 对 表 T 的 任何 内 容 都 成 立 ， 那 么 我 们 就 得 到 了 一 个 矛盾 。 从 
这 一 点 我 们 可 以 下 结论 ， YY 一 所 不 会 任何 属性 ， 即 YY 忆 X。 呈 

2. 阿姆斯特朗 公理 

包含 规则 是 蕴涵 规则 之 一 ， 通 过 它 可 以 产生 对 于 所 有 可 能 表 都 确保 成 立 的 明 数 依赖 。 看 起 来 从 
很 小 一 组 荀 池 规则 可 以 推导 出 所 有 其 化 的 规则 。 我 们 在 这 里 列 出 三 个 基本 规则 ， 并 称 其 为 阿 姆 斯 特 
朗 (Armshong ) 公理 (参见 图 56-19 )。( 其 他 规则 集合 可 以 同样 简单 地 给 出 ， 见 本 章 末 的 习题 ,) 


TD 一 一 人 人 人、: 


了 包 人 省 规则 传递 规则 












增 广 规则 


图 6-19 阿姆斯特朗 公理 
定义 6.6.6 ”阿姆斯特朗 公理 ”假设 给 定 -- 个 表 T， 以 及 Head(T) 的 子 集 X、Y、Z. 那么 我 


i 
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们 有 下 面 的 蕴 少 规则 . 

1) 包 售 规则 (Inclusion rule ) :如 果 Y 广义 ， 那么 一 Y。 

2) 和 传递 规则 { Transitivity rule ) : 划 果 XX 一 YHY 一 Z， 那 么 XX 一 世 ， 

3) 增 广 规则 【 Augmentation rule ) :如果 KX 一 YY， 那么 XZ 一 YZ. 

像 我 们 让 -个 函数 依赖 中 州 出 属性 并 在 它们 之 辣 加 入 空 属 来 表示 包含 这 些 属 性 的 集合 一 
样 、 两 个 顺序 排列 的 属性 的 集合 表示 -个 并 运算 。 所 以 增 广 规则 可 以 重 写 为 : 如 果 XX 一 Y， 于 
UZEOY UZ. 国 

我 们 已 经 在 定理 6.6.3 中 证 明了 和 包 会 规则 。 让 我 们 来 证 明 增 广 规 则 ， 并 把 传 递 规则 的 证 明 
作为 不 章 末 的 习题 。 

定理 6.6.7 增 广 规则 { Augmentation ) ”我 们 的 目标 是 证 明 如 果 X-+Y， 那 么 XX ZY 2。 
假设 XX 一 Y， 考 虚 表 T 的 任何 两 行 < 和 v， 它 们 在 XZ ( 也 就 是 XUZ) 的 属性 上 值 相 同 。 我 们 仅仅 
需要 证 明 * 和 v 在 Y Z 的 属性 上 不 能 取 不 同 值 。 人 是 因为 xz 和 vv 在 XZ 的 所 有 属性 上 和 值 相同 ， 所 以 
它们 当然 在 XX 的 所 有 属性 上 取 相 问 值 ;: 同时 因为 我 们 假设 X*+Y， 闭 和 和 v 必 须 在 YY 的 所 有 属 
性 上 值 由 同 。 同 样 ， 因 为 x 和 v 在 XZ 的 属性 上 值 相 同 ， 它 们 必然 在 Z 的 所 有 属性 上 值 相 同 。 因 
此 ，# 和 种 v 在 Y 的 所 有 属性 以 及 Z 的 所 有 属性 上 值 相同 ， 证 朋 结 束 。 国 

战 阿姆斯特朗 公理 ， 我 们 可 以 让 明 很 多 其 他 函数 依赖 中 的 蕴涵 元 则 ,进一步 讲 ， 我 们 可 
以 只 使 用 公理 本 身 曾 不 再 使 用 隧 数 依赖 定义 来 做 到 这 一 点 。 

定理 6.6.8 ” 阿 旭 斯 特 朗 公理 的 一 些 蕴 洱 ”我 们 再 一 次 假设 下 面 上 所 有 属性 集合 W、X、Y 和 
Z 和 包含 在 表 T 的 标题 行 中 。 

[1] 合并 规则 (Union rule )， 如 果 X-Y 且 X-Z， 那 么 X 一 YZ。 

[21 分 解 郁 则 【 Decomposition rule ) :如 果 X-YZ 那 么 X 一 * 阅 月 X 一 . 

[3|] 伪 传 递 规则 ( Pseudotransitivity rule ) :如 果 X 一 Y 有 WY 一 Z， 那 么 XW 一 ZZ。 

141 集合 暴 积 孝 刚 ( Set accumulation rule ) :如 果冻 -+YZ 朋 ZW， 却 么 XYZW. 


证 我 们 只 证 明 规 则 2 和 规则 4， 其 他 留 作 练 习 。 对 于 规则 2， 注 意 则 YZ=YLUZ， 那 么 根据 包 
会 规则 (公理 1 ) 有 YZz 一 Y。 根 据 传 递 规则 (全 理 2 }， 由 XX 一 YZ 和 YZ 王 Y 可 以 推出 X-*Y。 同 样 ， 
我 们 可 以 证 明 X 一 Z， 至 此 分 解 规则 2 得 到 证 明 。 对 于 规则 4， 给 定 (al X 一 Y7 和 【hj 7 一 W。 
利用 公理 3， 我 们 用 YZ 增 广 (b) 得 到 YZZz 一 ZW。 因 为 ZZ=Z， 所 以 我 们 有 【ce ) YZ 一 YZW。 
最 后 ， 由 传递 规则 ， 使 用 (a } 和 (c ) ,我 们 得 到 X 一 YZW， 人 和 集合 累积 规则 4 得 到 证 明 ， 国 


我 们 不 证 明 而 表述 一 个 非常 令 人 惊奇 的 结论 所 有 郴 数 依赖 中 有 效 的 昔 涵 规则 都 林 以 从 
阿姆斯特朗 公理 推导 出 来 。 事 实 上， 如 果 F 是 任何 一 个 画 数 依赖 集合 ， 屋 一 了 是 一 个 不 能 申 阿 
姆 斯 特 朗 公理 由 F 推 导出 的 欧 数 依赖 ， 那 么 一 定 有 一 个 表 T， 所 有 F 中 的 随 数 依赖 都 成 立 ， 人 让 XX 
一 不 成 立 。 因 此 ， 阿 姆 斯 特 划 公理 通常 被 称 为 是 完全 的 ， 意 思 是 没有 其 他 理 普 规则 需要 加 入 
其 中 来 增加 它们 的 效力 。 

阿 忆 例 6.6.3 中 ， 我 们 指出 来 自 例 5.6.1 中 的 三 个 函数 依赖 : 

emp_id 一 emp_name, emp_id 一 emp_phone，and emp_id -3 dept_name 

可 以 得 出 凿 数 依赖 (1) 成 立 的 结论 : 

itl} emp. id — emp_name emp_phone dept name 


两 次 运用 定理 6.6.8 的 合并 规则 可 以 得 出 这 个 事实 。 而 反方 同 的 列 涵 ， 妈 函数 依赖 (1) 列 涵 
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下面 二 个 数据 依赖 ， 可 以 两 次 运用 分 解 规则 得 到 。 无 论 什么 时 候 有 某 个 属性 集 X 出 现在 -一 组 消 
数 依 赖 的 左边 ， 我 们 就 可 以 计算 这 些 函 数 依 赖 右边 所 有 属性 构成 的 集合 的 并 ， 然 后 将 这 些 葬 
数 依 赖 组 台 成 为 一 个 。 例 如 ， 假 设 表 T 的 标题 行 有 属性 ABCDEEG， 并 凡 我 们 知道 下 面 这 
些 疯 数 依赖 成 立 ; 

BD = ARBDoCBD FBDo FandBD es 

那么 我 们 内 要 一 次 运用 合并 规则 就 可 以 把 这 些 函 数 依赖 组 合成 一 个 ，: 

[68.8.1] BDo=ACEFL 

事实 上 ， 我 们 可 以 加 入 平凡 菠 数 依赖 B DB DP， 得 到 

BD ABCDEFG 

如 果 能 够 从 一 组 史 为 基本 的 孙 数 依赖 通过 阿 姆 斯 特 庆 公 理 推导 出 一 个 函数 依赖 集合 ， 那 
么 我 们 通常 不 将 推 芝 出 的 依赖 加 入 进来 。 我 们 可 能 希望 回 到 消 数 依赖 [6.6.1] 的 形式 。 注 意 如 
果 我 们 有 另 一 个 属性 H 在 表 T 的 标题 中 ， 但 没有 在 任何 函数 依赖 中 被 引用 ， 那 么 除了 [6.6.1] 中 
的 函数 依赖 我 们 可 以 得 到 下 面 的 消 数 依赖 : 

BDH -= ACEFCGH 

但 是 因为 这 个 消 数 依赖 可 以 从 冰 数 依赖 [6.6.1] 通 过 增 广 规 则 推导 出 来 ， 所 以 我 们 里 趋 各 于 
较 短 一 些 的 函数 依赖 [6.6.1]。 

例 6.6.4 ” 列 出 下 面 表 T 满 足 的 卫 数 依赖 的 最 小 集 ， 假 设 设计 人 员 恰 恰 允 许 图 中 这 些 行 在 这 
个 表 中 存在 。 我 们 再 一 次 强调 通常 并 不 根据 表 的 内 容 得 出 郴 数 依赖 。 一 般 ， 我 们 通过 理解 数 
据 项 和 该 企业 的 规则 来 决定 函数 依赖 。 注 意 我 们 还 没有 一 个 严格 的 定义 来 描述 函数 依赖 的 最 
小 集 ， 所 以 我 们 只 是 简单 地 靠 直觉 来 试图 得 到 最 小 集 。 





分 析 ， 让 我 们 从 左边 只 有 一 个 属性 的 函数 依赖 开始 考虑 。 很 清楚 ， 我 们 总 是 有 平凡 汞 数 依 琥 ， 
AA&A，B 一 B，C—C 和 D 一 D。 但 是 因为 要 得 到 依赖 的 最 小 集 ， 所 以 不 打算 将 它们 列 出 来 。 从 这 个 特 
定 的 表 ， 我们 可 以 得 到 下 面 结论 : (a) 所 有 属性 B 的 值 相同 ， 因 此 对 任何 其 他 属性 P (也 就 是 说 P 是 A、 
C 或 者 D ) 都 不 会 有 ri(Pj=rP)TInGB) 关 i(B)。 所 以 我 们 得 到 A 一 B，C~+B 和 DD 一 B。 同 时 没有 其 他 属性 P 
函数 依赖 于 B。 这 是 因为 这 些 P 都 至 少 有 两 个 不 同 的 值 ， 所 以 总 有 商行 5 和 mm 满足 rm (P) 关 r,(P) 而 
fnBFoB)。 所 以 B- 关 ABC 有 BA D。(b) 因为 所 有 的 D 值 都 不 相同 ， 所 以 除了 《al) 部 分 的 D 
一 B 以 外 ,我 们 还 有 D 一 A 和 DPC; 同时 因为 所 有 其 他 属性 者 至 少 有 两 个 重复 的 值 ， 所 以 D 不 丙 数 依 
赖 于 尾 何 其 他 属性 。 因 此 除了 (a ) 部 分 的 B -了 D 外 ,我 们 还 有 AD 和 C 站 DD。 (tc) 我 们 有 A 让 CC 
(因为 行 ] 和 2 ) 和 CA A 因为 行 ] 和 3 )。 我 们 可 以 列 出 所 有 左边 共有 -- 个 属性 的 消 数 依赖 ( 和 非 郴 
数 依赖 六 《括号 中 的 字母 表示 了 它们 从 土 面 哪 一 部 分 中 得 来 。) 


ta) 盛 一 忆 fa}+ 台 为 志 iCjC 疙 点 Ib} D —A 
(tf) 有 办 性 ‘aj B PC ‘a} C—B ‘a}y D—B 
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{blAAAD tatBAD ‘bit»D {bj OD = 

由 合并 规则 ， 无 论 何 时 一 个 单独 出 现在 左边 的 属性 函数 决定 几 个 其 他 的 属性 ， 我 们 都 可 
以 合并 有 有 边 的 属性 。 如 上 面 的 局 ， 可 以 得 到 : D 一 A BC。 根据 到 此 为 下 的 分 析 ， 我 们 得 出 以 
下 函数 依赖 集 ( 我 们 认为 是 最 小 的 ): 

(1 站 一 昌 2c— B.D ABC 

现在 考虑 左边 有 成 对 属性 的 函数 依赖 。(d ) 通过 上 面 的 函数 依赖 (3) 和 增 广 规则 ， 可 知 任 
何 包 含 D 的 属性 对 都 湛 定 所 有 其 他 属性 , 所 以 不 存在 还 没有 被 将 池 的 左 迪 包含 D 的 新 函数 依赖 。 
te) 属性 B 若 与 任意 其 他 属性 P 联 合 出 现在 左边 ， 那 么 仍然 将 仅仅 函数 决定 已 经 被 P 决 定 了 的 
属性 。 如 同 我 们 在 下 面 讨论 中 着 到 的 。 如 果 P 六 Q， 就 意味 着 存在 行 r, 和 r; 使 得 r, (Q) 并 1Q) 
而 r(P)= r (P)。 但 是 因为 B 存 所 有 行 上 取 相 同 值 ， 并 且 我 们 知道 (BP)=rx(BP) 也 成 立 ， 所 以 
BE 天 Q。 因 此 我 们 不 会 得 到 左边 包含 B 的 新 了 消 数 依赖 。 

{f) 现在 唯一 左边 不 包含 B 或 者 D 的 属性 对 是 A C。 因 为 A C 在 每 一 行 上 有 不 同 的 值 ( 请 肯 
-次 检查 表 T )， 所 以 我 们 知道 A C 一 A B C D， 这 是 新 的 函数 依赖 。 我 们 可 以 通过 推理 规则 说 
明 这 一 点 : 根据 包含 规则 ，A C 一 A 和 A C 一 C 是 平凡 的。 并 且 我 们 已 经 知道 A 一 B， 所 以 很 容 
易 得 到 A C 一 B。 因 此 我 们 从 A CA B CD 得 到 的 唯一 新 函数 依赖 是 A C 一 D。 因 为 我 们 在 村 
找 函 数 依 赖 的 一 个 景 小 集 ， 所 以 我 们 在 下 面 列表 中 把 它 当 作 晴 数 依 赖 (4) 加 入 。 如 果 我 们 现 
在 考虑 左边 含有 三 个 局 性 的 艾 数 依 太 ， 我 们 看 到 从 已 经 有 的 函数 依赖 可 以 推出 : 任何 三 个 属 
性 函数 决定 所 有 其 他 属 件 。 任 何 含有 D 的 三 元 属性 对 显然 是 这 样 ， 唯 一 不 含有 D 的 三 元 属性 对 
是 A B C， 基 中 内 要 A C 就 可 以 师 数 决定 所 有 其 他 属性 。 显 然 ， 对 于 左边 含有 了 止 个 属 件 的 情况 
也 是 如 此 。 

所 以 ， 表 了 的 完整 函数 依赖 集 如 下 ， 

{A 8B, (21CoOB, Do ABC, HAC oD 

前 三 个 函数 依赖 来 自 于 先前 那个 左边 只 有 -个 属性 的 函数 依赖 列表 ， 而 最 后 一 个 聊 数 司 
赖 ，A CD， 是 从 左边 有 两 个 属性 的 情况 得 来 的 。 后 面 我 们 将 发 现 尽 管 为 推导 最 小 集 花 了 很 
大 力气 ,但 这 个 中 数 依赖 集 还 椒 是 完全 最 小 的 。 在 定义 了 函数 依赖 最 小 集 的 含义 之 后 我们 
就 会 发 现 这 一 点 。 | 

3. 闭 锯 、 媳 美和 最 小 蕉 盖 

从 阿姆斯特朗 公理 推导 出 的 函数 依赖 的 蕴涵 规则 意味 着 无 论 什 么 时 候 给 定 一 个 函数 依赖 
集 F， 都 可 以 推导 出 一 个 更 大 的 依赖 集 。 

定义 6.6.9 ”函数 依赖 集 的 闭 包 给 定 一 个 范 数 依赖 集 F， 它 作用 在 表 T 的 属性 上 。 我 们 定 
六 F 的 闭 包 为 可 以 从 F 推 导出 的 所 有 函数 依赖 的 集合 ， 记 为 F'。 血 


例 6.6.5 考虑 给 定 的 呵 数 依赖 集合 F; 

F={A=oB,BoOCC—=3DD EE EF G6,G—H} 

由 传递 规则 ，A 一 B 和 B 一 C 可 以 推导 出 A 一 C， 它 一 定 包 舍 在 F 中 .同样 ，B 一 C 和 C 一 了 D 推 
导出 B 一 D。 实 际 上 ， 如 果 在 序列 A B C D EF GH 中 一 个 属性 出 现在 最 后 -- 个 前 夯 ， 那么 它 可 
以 通过 传递 规则 来 函数 决定 序列 中 出 现在 它 右 过 的 每 -- 个 属性 。 我 们 也 有 平凡 函数 依 丸 如 A 一 
AA。 下 一 步 ， 使 用 合并 规则 ， 我 们 可 以 生成 其 他 函数 依赖 ， 例 如 A 一 A BCDEFGH。 事 演 
上 于， 通过 在 不 同 的 组 合 中 使 用 合并 规则 ， 我 们 可 以 得 到 A 一 {任何 A BC D EF GH 的 非 空 子 
集 )。 有 2-1=255 个 这 样 的 非 空 子 集 。 上 面 推导 出 的 所 有 函数 依赖 都 包含 在 F` 中 。 国 
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函数 依赖 通常 在 从 常理 规则 建立 数据 库 的 时 候 产 生 。 按 照 E-R 概 念 的 术语 ， 可 清楚 地 知道 
对 应 于 实体 标识 符 的 数据 项 图 数 决定 了 那个 实体 的 所 有 其 他 属性 。 类 似 地 ， 联 系 的 属性 被 参 
与 这 个 联系 的 实体 的 标识 符 叭 一 决定 。 在 我 们 的 设计 中 ， 我 们 通常 期 望 从 一 个 可 操作 的 落 数 
依赖 集 F 开 始 。 但 例 6.6.5 显 示 ， 由 下 推导 出 的 函数 依赖 集 可 能 以 指数 级 的 速度 增长 。 在 下 而 ， 
我 们 试图 寻找 一 种 方式 来 说 明 如 果 没 有 这 种 指数 集 脱 胀 ， 男 数 依 赖 集 F 可 以 推导 出 什么 。 我 们 
的 目标 是 找到 一 种 方法 来 求 出 等 价 于 FE 的 函数 依赖 的 一 个 最 修 集 。 我 们 还 将 提供 在 合理 时 间 内 
推导 这 个 最 小 集 的 算法 。 

定义 6.6.10 ”函数 依赖 集 的 覆盖 ” 表 T 上 的 两 个 函数 依 束 集 侣 F 和 G， 如 果 范 数 依赖 集 G 可 
以 从 F 用 昔 涵 规则 推导 出 来 ， 或 者 换 句 话说， 如 果 G CE ， 那 么 我 们 说 F 覆 盖 G。 如 果 F 覆 盖 品 
且 G 覆 盖 F， 邦 么 这 两 个 晴 数 依赖 集 称 为 等 价 的 ， 写作 F=G。 国 

例 6.6.6 考虑 属性 A B CD E 组 成 的 集合 二 的 两 个 孙 数 依赖 集 : 

F={B—o3CD,AD EB oA 


和 

G={Bo CDEBoABC,AD— E} 

我 们 将 让 明 F 窗 盖 G， 方 法 是 说 明 G 的 所 有 函数 依赖 可 以 由 F 的 随 数 依赖 推导 出 来 。 下 面 ， 
我 们 使 用 定义 6.6.6 和 定理 6.6.8 中 的 各 种 推导 规则 来 得 到 F 中 函数 依赖 的 蕴涵 式 。 因 为 在 F 中 有 
(a) BCD 和 (b)B 一 A， 则 合并 规则 ， 我们 有 (cc) B 一 A CD, 平 几 依 赖 B 一 B 显 然 成 立 ， 
它 和 tc) 合并 ,得 到 (d) B 一 A B CD。 由 分 解 规 则 ，B 一 A B CD 推导 出 (e) B 一 AD， 同 时 
因为 (f) A DE 在 F 中 ， 由 传递 规则 我 们 得 到 ( g ) B 一 E。 它 再 与 (d) 合并 ， 得 到 B 一 A BC 
D E。 根据 分 解 规 则 我 们 可 以 推导 出 G 的 前 黄 个 陪 数 依 琼 ， 而 第 三 个 已 绎 存在 于 F 中 。 由 此 证 明 
F 徐 盖 G。 国 

在 例 6.6.1 中 使 用 了 一 种 技术 ， 在 臣 数 依 畦 集 F 下 找 出 所 有 被 属性 B 帅 数 决 定 的 属性 。( 这 里 
恰 是 所 有 属性 。 ) 通常 我 们 可 以 对 函数 依赖 左边 的 任何 属性 集合 义 进 行 这 个 操作 ， 找 到 所 有 册 
X 函 数 决 定 的 属性 。 

定义 6.6.11 属性 集 的 闭 包 给 定 表 T 的 消 数 依赖 集 F 和 T 中 包含 的 属性 集 X， 我 们 定义 X 的 
闭 包 X*， 作 为 由 关 函 数 决 定 的 最 大 属性 集合 Y， 则 最 大 集合 Y 满 足 X 一 Y 存 在 十 F' 中 注意 ， 根 
据 包 含 规 则 ， 集 合 Y 一 定 包 含 了 XX 的 所 有 属性 ,但 可 以 不 包含 其 他 任何 属性 . 国 


这 里 是 一 个 求 任意 属性 集 X 的 闭 包 的 算法 。 
算法 6.6.12 ”集合 闭 包 这 个 算法 求 出 定 给 定 的 孙 数 依赖 集 F 下 ， 一 个 给 定 属性 集 X 的 闭 


包 X'。 国 
本 一 站 其 [OO = Xx; i integer 工 ， attribute set ED wd 
REPEAT i* loop to find larger XLI1] i 
J=1+1: +:* new 1 tj} 
xX[1] = xX[I-1]: A* initialize new XCIT] * 
FOR ALL 2 = WW in FF fs loop on al Fos 二 一同 in F wf 
IF i cc x[I] ik if 7 contained im XI ni 
THEN XLIT = 其 CI] wr W: i add attributes im H to XC[I] bn 
END FOR f* end Toop on FDs A 


UNTIL XEI] = x[1—1]: A* 100p until no new attributes wf 


澡 6 赣 几 据 磊 证 和 计 267 


RETURN X* ~ XxX[E]: A* return closure of x ty 

注意 ， 算 法 6.6.12 中 将 属性 册 人 到 XX[ 本 中 的 那 一 步 是 基 填 集 谷 守 积 规 则 的 ， 写 已 在 定理 
6.6.8 中 江 明 ;如果 X-+Y Z 有 AZ—W,， 那么 X 一 YZW。 

在 算法 中 ， 央 为 XX 一 X[ 囊 (我 们 的 归纳 假设 } 并 月 在 F 中 由 2Z 忆 久 [得 到 Z 一 W 后 ， 关 [DD] 可 
以 用 羡 Z 1Y=XD - 工 ) 来 表 天 。 所 以 我 们 可 以 把 X 一 XI 写成 X 一 Y 了 之。 现在 距 然 包含 Z- 一 W， 
孝 各 我们 可 以 根据 集合 累积 规则 推出 X 一 Y Z W， 或 者 换 句 话说，X 一 XII] UW， 同 时 维持 了 
我 们 的 归纳 假设 。 

集合 闭 包 是 我 们 所 进行 开发 中 的 一 个 重要 里 程 碑 。 人 它 给 我 们 提供 了 一 般 闻 法 来 确定 是 耕 
一 个 给 定 的 函数 依赖 可 以 从 孙 数 依赖 集 F 推 导出 来 ， 而 不 用 握 心 在 例 6.6.5 中 所 说 的 计算 F* 时 可 
能 出 现 的 指数 级 膨胀 ， 血 如 ， 假 使 我 们 需要 知道 喇 数 依赖 XX 一 A 是 否 可 以 由 六 数 依赖 集 F 推 导 
出 来 ， 我 们 只 和 需 简 单 地 在 F 下 使 用 集合 闭 包 算法 6,6.12 计 算出 六 "， 然 证 看 它 是 否 包 含 A， 如 采 
包含 ， 那 么 X- 一 A 在 F" 中 ， 即 它 可 以 由 F 推 导出 来 。 

我 们 将 看 到 表 的 键 恰 恰 是 这 个 表 中 可 以 函数 决定 所 有 属性 的 最 小 属性 集合 。 为 判定 匀 基 否 
是 -- 个 键 , 我 们 只 需要 在 该 表 的 属性 的 图 数 依赖 集 F 下 计算 X-， 香 它 是 古 包 括 了 表 中 全 部 属性 ， 
然后 确认 没有 X 的 革 个 子 集 也 广 足 这 一 点 。 

例 6.6.7 ”集合 财 包 和 它 的 一 个 紧 羔 推导 表示 在 例 6.6.6 中 ,我们 给 定 一 个 蚂 数 依赖 集合 F， 
编号 如 下 : 

F: BoCD, IAD E, 3B A 


给 定义 =B， 我 们 得 到 X=A BC D BE。 我 们 从 X[0]=B 开 始 使 用 算法 6.6.12。 那 么 XL[1]=B， 
然后 我 们 开始 在 函数 依赖 集中 循环 。 因 为 (1 B 一 C D， 我 们 得 到 X[1]=B C D， 为 品 示 C 和 D 是 
因为 晴 数 依赖 (1) 而 在 B 之 后 加 人 进来 的 ， 我 们 用 一 种 紧 深 表示 法 表示 成 B CD (1)。 下 -个 力 
数 依 赖 (2) A D 一 E， 在 这 个 时 候 不 起 作用 ,因为 AD 不 是 其 [1] 的 一 个 子 集 。 下 和 面 ， 由 (3) B 一 A， 
我 们 得 到 XX[11=A BC D (或 者 用 反映 梭 导 顺序 的 表示 法 ， 写 为 B C D (1) A (3))。 现 在 X[0] 严 
格 包含 在 X[1] 中 【也 就 是 说 ， 和 [LE 握 [四 )， 所 以 X[I-1] 关 关 [ 生 。 我 们 在 这 次 循环 中 取得 了 进 
展 ， 需 要 继 急 进行 下 一 次 循环 ,设置 X[2]=X[1]=A B CD (也 就 是 B CD (1) A (3))， 再 次 在 丧 
数 依 赖 中 循环 时 ， 我 们 看 到 所 有 了 苑 数 依赖 都 可 以 被 使 用 (但 是 我 们 跳 过 那些 己 经 使 用 过 的 ， 
因为 它们 不 会 产生 新 作用 )， 从 人 私 剩 的 销 数 依赖 (2} A D 一 E， 得 人 到 X|2]=A B C D E, 或 者 使 用 
推导 表示 法 ,写作 B C D (2) A (3) E (2)。 在 这 次 循环 的 最 后， 算法 发 现 X1l1] 一 X[2j。 央 为 有 
新 进展 ， 所 以 我 们 继续 计算 X[3]， 在 函数 依赖 中 继续 循环 一 次 ， 结 点 时 得 到 X[3]=X[21.， 如 来 
注意 到 所 有 浮 数 依赖 都 已 经 被 使 用 了 ， 就 可 以 省 赂 此 次 循环 。 注 意 ，F 中 哎 数 依赖 的 排列 顾 
序 不 同 将 改变 算法 执行 的 细节 。 在 后 面 练 习 中 ， 要 求 给 出 推导 表示 法 来 说 明 进 行 了 正确 的 推 
导 ， 那么 顺序 是 至 关 重 要 的 。 例如， 上 面 的 推导 产生 聚 凌 表 小: 

BCD' TABE (2) 

而 不 是 

BC DI) Et2) A. 

给 定 表 T 的 一 个 函数 依赖 集 F， 我 们 用 下 面 的 算法 来 计算 鹤 瘟 F 的 最 小 依赖 集 M。 集 合 M 晴 
小 是 指 没 有 M 中 的 函数 依赖 可 雇 从 整体 中 删除 或 者 通过 去 除 这 个 依 束 开 过 的 局 性 来 使 之 改 坚 ， 
而 不 丢失 它 覆 盖 F 的 性 质 。 

算法 6.6.13 “最 小 覆盖 ”这 个 算法 构造 最 小 师 数 依赖 集 M， 它 艇 疹 一 个 给 定 的 函数 依 顿 集 
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F。M 就 是 F 的 最 小 履 盖 ， 或者， 在 有 些 文章 中 ， 称 为 F 的 规范 履 盖 (canonical cover )。 
第 一 步 ”从 孙 数 依 束 集 F， 我 们 创建 函数 依赖 一 个 等 价 集 H， 它 的 隔 数 依 玉 的 右边 只 有 单 


个 属性 。 
H = 总; 7 二 inftialize H to Null set wi 
FOR ALL X= inf jt toop on FDs in F np 
FOR 点 LE A INY i* oop on attributes in Y x 
H= Hu {X= A}: A* add FD to HH 二 1 
END FOR i* end loop on attributes in ¥ x 
END FOR i* end oop on Fos in F Wd 


因为 第 一 步 顺 序 使 用 了 分 解 规则 来 淮 导 出 H， 并 且 F 可 以 以 H 通 过 顺序 的 联合 规则 来 重 构 ， 
所 以 显然 F==H。 

第 二 步 ” 从 郴 效 依赖 集 瑟 ， 顺 次 去 掉 在 生 中 非 关键 的 单个 函数 依 顿 。 -… 个 沙 数 依赖 X 一 Y 在 
-个 函数 依赖 集 也 中 是 非 关 键 的 ， 是 指 如 果 X 一 *Y 从 H 中 去 掉 ， 得 到 结果 J， 仍 然 有 H'= 卫 ， 或 者 
H=J。 就 是 说 ， 从 HH 中 去 队 这 个 函数 依 束 对 于 H* 没 有 任何 影响 。 图 6-20 给 出 了 非 关 键 函 数 依 束 
的 例子 。 





图 6-20 非 关 键 函 数 依赖 X 一 A 的 例子 


FOR ALL XX 一 下 in H rr Toop on FDs in H wi 
J=H- {X= AA: i try removing this FD wf 
DETERMINE XT UNDER J: Ja set closure algorithm 6.6.12 *) 
IFAE YX i a js Si implied by J 二 

He fr ,SO it is inessential in H | 

END FOR f end loop on FDs in H bk 


每 次 一 个 函数 依赖 按照 第 二 步 从 H 中 去 除 时 ， 结 果 和 集合 等 价 于 先前 集合 一 一 更 大 的 集合 H。 
从 这 一 点 可 以 非常 清楚 ， 最 终 集合 H 是 等 价 于 初始 集合 的 。 但 可 能 很 多 函数 依赖 已 经 被 删除 了 。 

第 三 步 ” 从 晴 数 依赖 集 H， 硕 次 用 左边 具有 更 少 属性 的 旺 数 依赖 替 措 原来 的 函数 依赖 ， 只 
要 不 会 导致 H 改变 。 图 621 给 出 了 可 以 按照 这 种 方式 简化 的 函数 依赖 的 例子 。 


HO = i* save original H 六， 
FOR ALL 其 3 Bh Tin H with #X > 1 fx Toop on FDs with muitiple attribute Ths*/ 
FOR ALL Be 甘 ji* oop on attributes 1m X wi 

¥ = XX— {B] Ff* try removing one attribute wi 

J tH- AU eft-reduced FD #1 
GENERATE ¥* UNDER JU。Y+ UNDER Hs/* set closure algorithm &,.6.12 i} 

IF Y” UNDER H = ¥* UNDER J 1 if YY is unchanged wi 

UPDATE CURRENT % — A 1n H rr this is XX > tn outer loop 二 7 


SET % = fw change X, continue outer Toop wi 


pr 
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END FOR 1:* end loop of attributes in 其 wj 
END FOR i end Ionp on FOS in H “i 
IF H <> HO i* if FD set changed in Step 3 wd 


REPEAT STEP 2 AND THEN GOTO STEP 4 了 本 retest: some FDS may be inessential now*/ 





图 6-21 一 个 明 数 焦 堤 X-* 友 的 例 于 ， 其 中 B 可 以 从 左边 删除 


第 四 步 从 和 镜 下 的 畏 数 依 事 集 中 收集 所 有 左边 相 问 的 了 晴 数 六 赖 ， 使 用 联合 规则 创建 一 个 等 
价 肖 数 依赖 集 M， 它 的 所 有 函数 依赖 的 左边 是 锥 一 的 。 


村 一 : A initialize M to nuill set wi 
FOR ALL XX Co A in HH i loop on FDs fn H Ff 
IF THIS FD 15 FLAGBED, CONTINUE:; A* if. naiready dealt with, lonp 二 
FLAG CURRENT FD: A* deal with FOS with XxX on Teft wf 
Y= tA}: i start with right-hand side nA 二 
FOR ALL SUCCESSIVE X — $ in tH i* nested 1o0p id 
FLAG CURRENT FD: As deal with all FDs, XX on Teft wf 

Y= {BR}: 1* gather attributes or right 二 7 

END FOR 4 gatharing complete Rj 
M= MY jw combine right sides of X — ? 二 
END FOR i* end uter Toop on Fos in H wi 


我 们 不 吉 证 明 地 说 明 这 个 算法 运算 时 间 只 按照 hn 的 多 项 式 增长 ， 其 中 0 是 F 的 鹃 数 依赖 中 属 
性 的 数目 (包含 重复 )。 第 三 步 开销 最 大 ， 因 为 我 们 需要 对 理 中 某 个 图 数 依 赖 左 边 的 伍 一 个 属 
性 进行 一 次 集合 闭 包 算法 。 如 果 我 们 在 第 二 步 之 前 进行 第 三 步 ， 那 么 根据 上 和 曾 第 三 步 的 晤 后 ， 
我 们 不 需要 返回 来 重复 第 二 步 ; 然而 如 果 没 有 第 二 步 先 来 做 清除 本 作 ， 对 么 费时 的 第 二 步 将 
做 更 多 的 工作 。 图 

例 6.6.8 构造 函数 依 顿 集 F 的 最 小 逢 盖 M，EF 如 下 : 

F: (iABD oS AC DICoORBRE,MWAD— BEIDB 下 

注意 当 你 在 函数 依赖 已 经 改变 的 地 方 开始 新 的 一 个 步骤 时 ， 重 写 明 数 依 束 集 很 重要 ， 这 
使 你 可 以 在 下 一 步 中 方便 地 引用 它们 。 

第 一 步 ”我 们 对 F 中 的 好 数 依赖 运用 分 解 规 则 ， 来 创建 一 个 等 价 集合 ,该 等 价 集合 的 所 有 
精 数 依赖 的 右边 只 有 单个 属性 :; 

H=IABD oA,DWABDoOCIDCoB,D Co EAD OB OAD FENB = E, 

第 二 步 ”我们 分 别 考虑 这 七 个 编号 函数 依赖 各 自 的 情形 。 

(1) A B D 一 A 是 平凡 的 ， 所 以 显然 不 关键 {因为 A B 了 包含 了 六)， 它 可 专 被 除去。 保留 
在 H 中 的 函数 依赖 是 (2) A B DC, (3} C+—B, (4) C—E, (5) AD 一 B, (6) A D 一 F 和 (7) B-*E。 


270 条 据 肆 原理 、 锋 程 与 性 非 


(2) A B D 一 C 不 能 够 众 H 中 的 其 他 也 数 依赖 根据 集合 闭 包 算法 (算法 5.6.12 ) 推导 出 来 ， 
因为 没有 其 他 函数 依赖 的 右边 包含 C. (A B D'， 除 去 函数 依赖 (2)， 将 不 包含 C。 我 们 也 可 以 
使 用 算法 6.6,12 中 的 步 又 来 证 明 这 个 事实 。 见 下 面子 步骤 (6)。) 

(3) CB 是 不 关键 的 妈 ? 如 果 { (2) A B DC, (4) CoE, (5) A D-~B, 16) A D—F, (7)B 一 BE 
} 钥 拿 出 来 它 可 以 从 这 些 丽 数 依 顿 推导 出 来 吗 ?” 为 了 知道 C 一 B 是 否 是 关键 的 ， 我 们 在 上 面 
这 个 小 一 些 的 函数 依赖 集 下 生成 C*'. (我 们 使 用 集合 闭 包 算法 6.6.12， 在 下 面 生成 X*， 并 使 用 
例 6.6.7 中 介绍 的 推导 表示 法 。) 从 C=C 开 始 ， 由 函数 依赖 (4) 得 到 C'=C E。 为 了 指明 使 用 了 函 
数 依赖 (4}， 我 们 记 为 C'=C E(4)、 现 在 在 函数 依 帆 (3) 去 除 以 后 ， 没 有 其 他 了 消 数 依赖 的 左边 包 售 
在 集合 CE 中 ， 所 以 我 们 得 到 了 属性 C 的 完全 闭 包 。 既 然 C` 不 包含 B， 那 么 (3) C 一 B 是 关键 的 并 
保留 在 H 中 ， 

(4) C 一 BE 和 十 不 关键 的 ， 这 可 以 通过 将 明 数 依赖 (4) 去 掉 而 计算 C 的 集合 闭 包 看 出 来 : 我 们 得 
到 Ci=C B (3) E (7)。 所 以 既然 在 函数 依赖 (4) 去 掉 后 E 在 C' 中 ， 那 么 我 们 可 以 除去 函数 依 圳 (4)， 
留 在 H 中 的 苹 数 依赖 是 (2) A B D 一 C, (3) C—B, (5) A D-*B, (6) A DF 和 {7) B-*E， 

(5) 去 挥 妙 数 依 赖 (5) 之 所 剩 下 的 函数 依赖 集 是 {(2) A B DC, (3) CB, (6) AD 一 R (7)B 
一 BE }， 在 这 个 消 数 依赖 集 下 ，A D 一 B 是 不 关键 的 吗 ? 在 集合 闭 包 算法 中 ，A D'=A DF (6) 而 
没有 其 他 属性 。 所 以 函数 依赖 (5) 是 关键 的 ， 不 能 被 除去 。 

(6) 除去 函数 依赖 (6) 之 后 的 函数 依赖 集 {(2) A B DC, (3) C 一 B, (5) A D—B, (7} B :E} 
F ，A DF 是 不 关键 的 吗 ? 显然 由 这 个 孙 数 依赖 集合 ， 我 们 可 以 排 导 出 A D'* 包 含 A DB (3)C 
(2) E (7)， 除 了 F 之 外 的 所 有 在 右边 出 现 的 其 他 属性 都 被 包含 了， 所 以 没有 函数 依 环 (6)， 我 们 
就 无 法 推导 出 A DP 一 F。 另 一 种 说 法 是 ， 如 果 把 函数 依赖 (6) 除 去 ， 没有 哪个 函数 依赖 右边 包含 
F， 所 以 A D 一 F 不 能 被 推导 出 来 。 

(7) 在 除去 函数 依赖 (7) 之 后 的 函数 依赖 集 {(2) A B DC, (3} C—B, (5) AD 一 B, (6) A DD— 
F} 下，B 一 EB 是 不 关键 的 吗 ? 回答 是 “并 非 不 关键 "， 因 为 出 这 个 函数 依 顿 集 推导 BH' 只 能 够 得 
到 B。 

我 们 结束 第 二 步 ， 得 到 集合 H={ (2) A B D 一 C, (3) C 一 B, (5) A DB, (6) A DF (7) B 一 
E }， 为 了 在 第 三 步 中 引用 方便 ， 我 们 重新 编号 如 下 : 

H=(DABDoOC, (CoB, (VAD B, (HIAD. EF (5)8.,E 

第 三 步 ”我 们 从 卫 数 依赖 (1) 开 始 。 注 意 到 左边 有 多 个 属性 ; 我 们 把 它 左 边 的 属性 集合 记 
为 X=A B D。 那 么 我 们 需要 尝试 每 次 去 除 X 中 的 一 个 属性 来 缩减 和 ， 并 创建 一 个 新 的 瑚 数 依 赖 
集 J。 

去 除 太 ?我 们 试图 从 遇 数 依赖 (1) 中 去 掉 属性 A， 那 么 新 的 集合 J 有 有; (1) B DC, (2) CB， 
(3) AD 一 B, (4) AD 一 FRR (5) B 一 E。 为 了 说 明 缩 减产 生 一 个 等 价 函 数 依 赖 集合 ， 我 们 需要 说 明 
B D (在 HF ) 与 B D (在 JF ) 是 相同 的 。 这 里 的 风险 在 于 J 下 的 B DD' 将 比 HFB 函数 决定 
更 多 的 属性 ， 因 为 I 有 一 个 函数 依赖 ， 其 左边 只 有 B PD， 而 H 没 有 。 我 们 声称 两 个 函数 依赖 集 
侣 是 等 从 的 ， 当 日 仅 当 B D (HF ) 和 B D' (J 下) 是 相同 的 。 所 以 我 们 计算 H 下 的 B D' 得 到 B 
D BE (5)， 这 十 全 部 的 。 在 J 下 ，B 是 B DC (1) E (3)。 既 然 它 们 不 相同 ， 那 么 我 们 不 能 够 用 
(1) B D 一 C 米 替换 (1) A B D 一 C。 

去 除 B? 我 们 重复 这 个 方法 。 现 在 J] 包 合 (1) A DD 一 C, (2) C 一 B, (3) A DB, (4) A D—F, (5) 
B 一 FE, J 下 的 AD' 是 A D C0)B (2)F (4)E(5)。 但 是 在 H 下 ,A D'=AD B (3)F (4)E(5)C(), 
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它们 是 相 问 的 集合 ， 但 是 产生 顺序 不 相同 。 你 需要 使 用 和 其 有 正确 顺序 的 推导 表示 形式 米 赔 明 
集合 闭 包 算法 运用 到 了 正确 的 函数 依赖 集 上 。 在 H 下 ， 吕 数 依赖 (3) 第 -个 扩展 A DD' 闭 包 , 在 
第 二 轮 中 国 数 依赖 41) 起 作用 在 JI 了 ， 当 我 们 在 第 轮 中 按 顺 序 处 理 函 数 依赖 时 ， 我 们 可 以 使 
用 每 一 个 咀 数 依赖 。 扰 论 如 何 ， 既 然 H 下 的 A D 和 本 的 AD 是 相同 的 ， 那 么 我 们 可 以 缩减 困 
数 依 赖 (1)， 使 其 左边 只 有 A D。 肯 数 依赖 集 世 现在 成 为 : 


H=IAD C2 CoB,13AD BAD oF ->E 


去 除 D? 我 们 已 经 考虑 过 从 函数 依赖 (1) A B D 一 C 的 左边 去 除 A。 既 然 B 已 经 除去 ， 奢 么 
我 们 不 需要 上 青 考虑 B。 但 是 我 们 必须 洽 虑 去 除 D。 现 在 ] 将 和 包含: (1) A 一 C, (2) 0 一 B, (3) AT 
一 +*B, (4) A DD-+F 和 {5) BE。 我 们 需要 考虑 在 HF 下 (A'=A) 和 J 下 (A'=AC(1)B (2)E (5)) 得 
到 A:。 由 于 它们 不 相同 ， 那 么 我 们 不 能 从 晃 数 依赖 (1 中 去 除 D。 

我 们 人 往 意 到 函数 依赖 (2) C 一 B 不 能 在 左边 做 任何 缩 碱 ，(3) A D 一 B 问 样 不 能 够 在 堪 贮 做 任 
和 何 缩减 ， 因 为 在 H 下 A- 和 D 将 上 只 包 售 这 些 属性 ， 而 在 对 应 J 的 财 包 中 包 合 有 B。(4) A D 一 F 不 
能 缩减 的 讨论 与 此 类 但。 

现在 ， 因 为 联 的 哆 数 依 赖 集 在 第 二 步 的 执行 中 被 改变 ， 我 们 入 要 返回 介 第 二 步 。 在 我 们 
到 达 孙 数 依 赖 (3) 并 考虑 是 否 去 除 (3) A D 一 B 时 ,我 们 现在 发 现在 { (1) AD 一 CC2) CC 一 B,， (4) 
A DF, (5) BE} 下 A DD' 为 A DC (1) B (2)。、 申 然 A TD 在 不 考虑 函数 依 顿 ( 3) 时， 包 售 BEB， 那 
么 这 个 另 数 依赖 是 不 关键 的 ， 可 以 去 除 。( 重复 第 二 步 非常 重要 ! ) 第 三 步 完 成 后 的 最 终结 
果 是 : 

H = (人 站 口 一 它 (20CoB, MAD FH):E 

这 个 集合 是 最 小 的 ， 如 果 你 愿意 ， 你 可 以 再 执行 一 次 第 二 砂 和 第 三 步 使 自己 确信 不 会 店 
有 其 他 改变 。 

最 后 ， 由 第 四 步 得 到 最 终 的 因数 依赖 集合 : 

H=s(1AD-= CF 20 ooB,(3B~—E 加 


为 了 理解 我 们 所 取得 的 结果 ， 你 可 以 做 一 下 例 6.6.8， 考 虑 在 函数 依赖 集中 做 的 每 一 次 变 
动 ， 然 后 试 试 使 用 阿姆斯特朗 公理 来 证 明 实 际 进行 的 每 一 次 变动 将 导 北 同样 的 孙 数 依赖 闭 世 . 
( 不 要 机 械 也 重复 对 集合 闭 包 的 讨论 ， 请 找 出 直接 的 证 明 表 明 变 动 是 合法 的 . ) 

例 6.6.9 ”我 们 在 例 6.6.4 中 推导 出 的 函数 依赖 看 起 来 不 是 最 小 的 ， 尽 管 我 们 的 目标 是 在 都 
个 例子 中 创建 一 个 最 小 的 集合 。 对 此 的 证 明 留 做 练习 。 加 


例 6.6.10 在 例 6.6.3 中 为 emp_info 数 据 库 表 述 的 函数 依 束 集 如 下 ， 


{3} emp_id — emp_name emp_phone dept_name 
(2} dept_name > dept_phone dept_mgrname 
13) skil1_id — skill_name 


{ emp_id skill_id 一 skill_date skill_ lvl] 
它们 已 经 梅 成 了 - -个 最 小 集 。 就 是 说 ， 最 小 餐 盖 算 法 6.6.13 不 会 进一步 缩减 它 。 我 们 把 这 
个 推导 留 作 练习 。 国 


在 后 面 章节 中 使 用 规范 化 方法 进行 正确 设计 的 算法 中 ， 寻 找 阔 数 依赖 集 F 的 一 个 最 小 乾道 
的 算法 是 至 关 重 要 的 。 
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6.7 无 损 分 解 


规范 化 过 程 依赖 于 将 一 个 骨 分 解 成 为 两 个 成 者 更 多 较 小 的 表 ， 在 这 种 方法 中 ， 我 们 可 以 
把 分 解 出 的 表 连 接 起 来 重新 获得 到 原始 表 的 详细 信息 。 

定义 6.7.1 无损 分 解 ”对 于 任何 表 T 以 及 它 的 一 个 末 数 依赖 集 FE，T 的 -- 个 分 解 是 一 个 表 
的 集合 {T,T:…Tej， 该 集 台 具有 两 个 性 质 : ( 1) 对 于 这 个 集合 中 的 每 一 个 表 T,，Head(T) 是 
Head{T}) 的 一 个 子 集 ; (2 ) Head(T)=Head(T,))U Head(T))U…UHead(T,)。 给 定 表 T 的 特定 内 
容 ， 即 T 的 行 被 投影 到 每 个 的 列 上 作为 分 解 的 结果 。 如 时 对 于 表 T 的 任何 内 容 ，F 中 的 函数 依 
赖 都 保证 如 下 关系 成 立 则 称 表 T 的 一 个 分 解 相对 于 鹃 数 信赖 集 F 是 - -个 无 损 分 解 ， 有 时候 也 称 
为 ~- 个 无 损 连 接 分 解 即 满足 : 


TT M2M., .MITk 
| 


有 时 候 ， 表 T 被 分 解 后 ， 不 能 道 过 将 分 解 出 的 表 连 接 起 来 而 恢复 原始 表 的 所 有 信息 。 这 不 
是 因为 我 们 设 有 得 到 所 有 以 前 存在 的 行 ， 而 是 内 为 得 到 了 原先 设 有 的 行 ， 


例 6.7.1 一 个 有 损 分 解 ”考虑 下 面 表 ABC: 





然而 ， 连 接 这 两 个 表 得 到 的 结果 如 下 : 


AB JOIN BC 





这 不 是 ABC 表 的 原始 内 容 ! 注意 ， 如 果 处 理 的 表 是 ABCX， 即 ABCY 利 ABCZ 中 的 作 意 一 
个 ( 见 下 面 )， 那么 同样 的 分 解 表 AB 和 BC 将 产生 与 AB JOIN BC 内 容 相 同 的 结果 。 


一 一 Terra re iiry am iuLL -~ 和 
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因为 我 们 不 能 够 确定 开始 时 的 表 内 容 到 底 是 什么 ， 所 以 信息 在 这 个 分 解 以 及 其 后 的 连接 
操作 中 被 天 失 了 了 ， 这 称 为 有 融 分 解 ， 或 者 有 时 候 称 为 有 损 连 接 分 解 。 加 

在 例 6.7.1 的 分 解 中 ,我们 丢失 信息 的 原因 是 ， 属 性 B 在 被 分 解 的 表 的 不 同行 中 具有 重复 值 
( 200 ) (在 表 AB 中 行 2 和 a4， 在 表 BC 中 的 行 c2 和 c4 )。 当 这 些 分 解 出 的 表 连 接 时 ， 我 们 得 到 交 
多 结业 行 在 原始 表 中 不 存在 (或 可 能 不 存在 ): 


和 
200 | cz 


例 6.7.2 “” 表 ABC 的 不 同 内容 ”现在 让 我 们 从 表 ABC 的 … 个 不 同 的 内 容 弄 始 再 进行 一 次 ， 
此 时 列 B 中 没有 重复 值 。 





问题 是 这 样 的 : 如 果 我 们 把 表 ABC 分 解 成 为 两 个 表 AB 和 和 BC， 如同 便 6.7.1 中 那样 ， 那 么 
分 解 纺 采 是 不 是 无 损 的 呢 ? 管 案 是 : 不 是 。 因 为 无 损 分 解 的 定义 要 求 分 解 出 的 表 的 连接 能 得 
到 原始 表 的 信息 ， 市 这 应 当 对 原始 表 将 来 任何 可 能 的 内 容 成 立 。 但 是 我 们 可 以 通过 持 人 一 行 
到 刚才 给 出 的 表 ABC 中 而 得 天 全 6.7.1 的 表 。 似 乎 汕 有 任何 规则 可 以 阻止 这 种 情况 的 发 生硬 

我 们 需要 什么 样 的 规则 来 限制 表 ABC 将 来 所 有 可 能 的 内 容 ， 以 使 分 解 成 表 AB 和 BC 是 无 
损 的 呢 ? 理所当然 函数 依赖 距 人 脑海 ， 因 为 它们 确定 了 控制 于 将 来 内 容 的 规则 。 注 意 到 在 定 
义 6.7.1 无 损 分 解 中 ， 一 个 函数 依赖 集 F 被 认为 是 表 T 定 义 的 一 部 分 。 我 们 扩展 第 2 章 中 数据 库 
模式 的 定 立 。 

定义 6.7.2 ”一 个 数据 库 模式 是 数据 库 中 所 有 表 的 标题 的 集 台 ， 以 及 设计 者 希望 在 那些 表 
的 连接 上 成 立 的 所 有 函数 依赖 的 集合 . 国 

例 6.7.,3 具有 一 个 函数 依赖 的 讲 ABC 假设 表 ABC 被 定义 了 ， 它 遵循 图 数 依 赖 B 一 C。 现 
存 例 6.7.2 中 的 表 具 容 是 完全 合法 的 : 
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这 个 揪 人 将 失败 ， 因 为 它 将 破坏 遇 数 依 炽 B-*C。 一 个 新 的 行 在 B 上 取 重 复 值 也 必然 使 C 具 
有 重复 值 ， 以 维持 B 一 C 成 立 : 


那么 ， 表 ABC 的 这 个 新 内 容 一 定 能 够 无 损 地 分 解 然 后 重新 连接 吗 ? 答案 是 肯定 的 ， 从 下 
表 着 始 : 


ABC 





如 傈 我 们 把 它 分 解 成 为 AB 和 BC 两 部 分 ， 我 们 得 到 下 面 的 肉 容 : 


AB Bt 





注意 到 因为 有 重复 值 ， 和 在 表 BC 中 原来 的 四 行 被 投 县 成 为 三 行 。 现 在 当 这 两 个 表 再 次 连接 
时 ， 可 以 得 到 原始 表 以 及 它 的 函数 依赖 B 一 C。 国 

因为 例 6.7.3 表 ABC 的 函数 依赖 B 一 C，ABC 在 BC 上 的 投影 将 总 是 在 属性 B 有 了 唯 -- 值 。 回 忆 
定义 2.4.1， 这 意味 着 属性 B 是 表 BC 的 一 个 键 。ABC 分 解 成 AB 和 BC 是 无 损 的 ， 原 因 在 于 当 它 
们 连接 时 没有 痰 及 会 发 生 ， 虽然 列 了 B 的 重复 值 在 表 AB 中 会 出 现 ， 但 是 表 AB 的 每 一 行 都 与 表 
BC 的 唯一 一 行 连接 【假设 这 个 B 值 在 表 BC 中 存在 ， 因 为 从 ABC 投影 行 的 初始 分 解 中 这 总 是 成 
立 的 )。 回 忆 在 CAP 数 据 库 中 ， 将 DRDERS 和 CUSTOMERS 连 接 时 所 发 生 的 和 情况。 我 们 简单 地 扩 - 
展 CRDERS 的 行 ， 加 人 更 多 关于 顾客 的 信息 。 重 复 值 会 在 表 ORDERS 的 ciqd 列 中 存在 ， 而 ia 
值 在 表 CcUsTOMERS 中 是 唯一 的 ， 所 以 ORDERS 中 每 一 行 恰恰 与 CUSTOMERS 的 一 行 连接 、 

我 们 将 上 面 的 讨论 一 般 化 ， 以 处 理 属 性 集合 。 

定理 6.7.3 ”给 定 表 fT 和 属性 集 X 入 Head(T)， 下面 的 两 个 陈述 是 等 价 的 :1) 六 是 T 的 一 个 
超 键 ; (2) X 一 Head(T)， 即 属性 集 X 函 数 决 定 了 T 中 所 有 属性 。 等 价 表述 为 : X=Head(T)。 
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证 (1) 推出 {2)。 如 果 XX 是 表 T 的 一 个 起 键 ， 那么 由 定 头 2.4.1]， 对 表 了 的 任何 内 容 ， 两 
个 不 同 的 行 必须 华 X 上 上 不同 ， 即 不 同 的 行 不 能 在 和 X 的 所 有 属性 上 取 相 同情。 但 是 由 此 ， 很 明显 
两 行 z 和 * 丰 能 在 X 上 相同 而 在 Head(T) 的 其 他 列 上 不 同 〈 因 为 如 果 两 行 在 X 上 上 相同， 那么 它们 
必然 代表 同一 行 }， 同 时 这 意味 善 X 一 Head(TY,。(2) 推出 (1)。 类 似 地 ， 如 果 X 一 Head(T)， 
那么 对 表 T 的 任何 可 能 内 容 ，T 的 两 行 不 能 在 X 上 具有 相同 值 ， 而 同时 在 Head(T) 的 属性 上 取 不 
同 值 . 但 是 如 果 了 琴行 和 * 在 HeadfT) 的 任何 属性 都 相同 ， 那 么 根据 关系 规则 3， 它 们 必须 是 问 
-- 行 。 这 说 明 两 个 不 同 的 行 不 能 在 X 上 有 取 相 同 值 ， 所 夷 X 是 工 的 一 个 超 键 - 图 


我 们 已 经 可 以 给 出 这 种 无 损 分 解 的 一 般 规 则 了 ， 后 面 在 进行 规范 化 时 将 使 用 这 个 规则 ， 


定理 6.7.4 给 定 去 T 和 它 的 有 效 孙 数 依 丈 集 FE， 一 个 把 T 分 为 两 个 表 {T1.T21 的 分 解 是 工 的 
一 个 无 损 分 解 ， 当 是 仅 当 HeadfT,) 和 HeadtT,) 部 是 HeadfT) 的 真子 集 ，HeadfT)=HeadfT)U 
Head{T,) (也 就 是 说 ，T 的 所 有 属性 在 T, 或 者 T, 中 重复 )， 同 时 如 下 昌 数 依赖 之 一 可 以 通过 F 排 
字 出 来 : 

{1) Head(T }N Head(T,)—Head(T,) 

或 者 

(2) Head(T)N Head(T,)—*Head(T,). 图 

证 ”我们 考虑 给 定 表 T， 它 分 解 成 为 T, 和 T:， 以 及 本 数 依赖 (1 Head{T)) 阁 Head(T,) 一 
Head(T,)。( 对 函数 依赖 (2) 的 证 明 层 相同 的 。) 在 后 面 ， 我 们 用 X 表 示 属 性 集 Head(T,)D 
{HeadT,); Y 是 属性 集 HeadfT,) - Head(T:)，Z 是 属性 集 Head(T;) - HeadtT,)。 首 先 ， 我 们 分 
解 的 定义 《定义 6.7.1 )， 即 Ti 和 T; 是 T 的 投影 则 Head(T)UHead(T:)=Head(T)。 我 们 可 以 证 明 
Ti 志 TOT。T 的 每 一 列 都 在 T mT, 中 出 现 ， 如 果 u 是 T 的 一 行 ， 我 们 说 4 在 Head(T,) 上 的 投影 
是 yx,， 它 是 属 件 值 的 连接 ， 其 中 y, 代 表 在 Y 中 属性 的 值 ， 而 x, 代 表 在 和 中 属性 的 值 ; 类 似 地 ， 
xz 是 2 在 HeadfT 上 的 投影 。 显 然 ， 落 X=HeadtTImHeadTJ， 那 么 在 HeadfT) 上 的 投影 与 
在 Head(T,) 上 的 投影 在 属于 XX 的 属性 | 具有 相同 的 值 。 同 时 由 连接 的 定义 ( 定 尽 2.7.4 )， 行 & 
(个 连接 57 ) 将 在 T MT, 中 出 更， 

现在 我 们 在 假设 T, mT: 人 了 情况 下 证 明 。 假 设 从 T 中 的 行 &， 我 们 通过 投影 得 到 Ti 中 的 一 
和 yx:， 同 上 。 类 似 地 ， 假 设 从 了 中 的 行 w， 我 们 得 到 T, 中 的 行 x,z,， 其 中 x; 代 表 X 中 访 性 的 值 ，。 
现在 很 设 T, 和 T, 中 的 行 yjx, 和 x,z; 可 以 连接 ,那么 x 所 有 属性 与 x, 的 相同 ， 而 且 y,x.z; 在 T，MT, 中 ， 
这 是 T MT; 中 行 的 一 般 形 式 ， 我 们 只 要 说 明 这 行 也 在 T 中 。 我 们 用 z, 表 示 T 中 行 w 在 y.x. 上 投影 
后 ， 剩 下 的 属性 值 。 所 以 w=y,x,z,， 同时 z,=z,。 这 基因 为 行 w 在 了 的 属性 上 与 v 的 值 相同 ， 而 X 
一 HeadtT2)， 所 以 ，X 一 Head(T,) - Head(T,)=Z。 又 因 鸭 u 和 v 在 X 上 值 相 同 ， 所 以 它们 必然 在 Z 
的 属性 上 取 相 同 值 。 内 此 z=z,， 行 yx 在 T, %T; 中 ， 且 与 T 中 的 行 yx.z、 相 癌 ， 

我 们 将 在 练 当中 证 明 ， 如 果 Head(T) 和 Head(T,)) 都 是 Head(T) 的 真子 集 ，Head(T)=Head(7T,) 
UHead{T,)，Head(T) 作 Head(T;) 不 消 数 决定 Head(T} 或 者 Head(T,))、 那 么 把 T 分 解 为 T, 和 T, 是 
无 损 的 。 图 

例 6.7.4 在 例 6.7.3 中 ， 我 们 演示 了 表 T ( 标题 是 A B C， 有 明 数 依赖 B 一 C ) 分 解 成 表 T ,和 
T:，Head(T)=A B，Head(T,)=B C。 如 果 我 们 运用 定理 6.7.4， 我 们 有 Head(TJmHead(T3 
HeadfT)， 也 就 是 ABPmBCBC， 即 B 一 B 人 各 ， 这 从 8 一 C 是 显 而 易 时 的 。 是 


例 6.7.5 “考虑 例 2.7.7 中 通过 CUSTOMERS 和 DRDERS 的 连接 得 到 的 表 CcUSTORDS。 显 然 ， 
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ordno 是 CUSTORDS 的 一 个 键 ， 因 为 它 具 有 唯一 值 、 读 者 也 可 以 推导 出 函数 依赖 ci q- 一 
Head {CUSTOMERS)。 现 在 我 们 注意 到 Head(CUSTOMERS)NnHead(ORDERS)=cig， 这 是 
CUSTOMERS 的 键 ， 所 以 Head(CUSTOMERS) 丫 Head(ORDERS)Head(CUSTOMERS})。 根 据 定 
理 6.7.4，CUSTORDS 分 解 成 CUSTS 和 ORDS 是 无 损 的 ， 它 们 分 别 与 CUSTOMERS 和 和 ORDERS 具 有 
相同 的 标题 《我们 需要 验证 从 CUSTORDS 投 影 到 CUSTS 和 CRDS 的 行 与 我 们 在 CUSTOMERS 和 各 
CRDERS 中 使 用 的 行 相 同 )， 这 个 分 解 看 起 来 是 直观 的 ， 原 因 在 了 -CUSTOMERS 利 ORDERS 连 接 
后 ， 我 们 扩展 表 ORDERS 的 每 一 行 ， 扩展 的 内 容 来 自 与 这 行 中 唯一 cid 值 相关 联 的 
customers 的 列 。 因 此 很 显然 ， 我 们 设 有 在 分 解 成 CUSTOMERS 和 DRDEFRS 的 标题 时 香 和 任何 
信息 。 当 然 如 果 有 一 些 顾客 没有 任何 订单 ， 那 么 当 我 们 最 初创 建 表 CUsTORDS 时 可 能 已 经 于 
失 了 一 些 信 息 ,。 但 是 无 损 分 解 是 从 表 cCUSTORDS 开 始 的 ， 并 确保 在 分 解 时 没有 信息 天 和 失 。 国 

定理 6.7.4 显 示 了 如 何 证 明 表 TT 分 解 成 {T,,T,} 蚌 一 个 无 损 分 解 。 旭 果 分 解 成 二 个 或 型 多 世 ， 
{TT 了,T}， 大 扎 3， 我 们 可 以 利用 两 个 表 时 的 结果 递归 地 证 明 无 损 性 。 


例 6.7.6 ”多 个 囊 的 无 损 连 接 分 解 ” 假 设 给 定 表 T，Head{T)=A B CDEF,， 以 此 函数 依赖 
(1) A BC, (2) A 一 D, (3} B 一 E。 广 意 没 有 关于 属性 F 的 螨 数 依赖 ， 但 是 A B 构 成 了 ABCDE 
的 一 个 键 ， 因 为 它 的 闭 包 包含 了 所 有 这 些 属性 、 因 为 键 必 须 晒 数 决 定 Head(T) 中 的 所 有 内 容 ， 
所 以 表 T 的 键 一 定 是 A B F。T 的 一 个 可 以 接受 的 无 损 分 解 是 {T,,T.,,T,,T,}， 其 中 Head(T)=A BC 
(这些 表 的 键 用 下 划 线 标注 })、Head(T)=A D、Head(T)=B E 和 Head(T,)=A B F。 这 些 表 的 联合 
包含 了 T 中 的 所 有 属性 ， 所 以 我 们 侈 需要 证 明 无 损人 性 。 注 意 ， 如 果 我 们 用 下 面 的 顺序 一 对 一 对 
地 连接 表 ， 则 可 以 根据 定理 6.7.4 保 证 每 一 个 括 起 来 的 表 连 接 与 下 一 个 将 和 它 连接 的 表 共 同 构 
成 一 个 无 损 分 解 。 

(TD T2) bd Ta bd Ta 

我 们 注意 到 Head(T,)=A B C, Head(T,)j=A DD，Head(T, WT,)=A B CD, Head(T)=B E, 
Head(T, MT,) MT)=A BCDE， 所 以 下 面 的 函数 依赖 保证 多 个 表 连 接 所 期 户 的 无 损人 性 。 

Head(T,) NHead(T)=A—Head(T,}=A D， 因 为 (2) A 一 D。 

Head(T1 MT2) NHead(T3)=B 一 Head(T3)=B E， 因 为 (3) B 一 E。 

Head((T1 mT2) MTN Head(T4)=A BHead(T =A B C， 因为 (1) A B 一 C。 

因为 连接 运算 有 结合 性 ， 所 以 无 损 性 不 要 求 连接 的 特定 顺序 ， 我 们 可 以 在 表述 式 ((T, % 
T; %T,) mT4 中 去 掉 括号 。 四 

在 前 面 见 节 中 ， 我 们 已 经 有 了 计算 给 定 集 含 F 的 最 小 函数 依赖 集 的 算法 ， 并 定居 了 无 损 分 
解 的 含义 。 在 后 面 一 节 中 ， 我 们 将 学 习 函 数 依 赖 的 最 小 集 如 何 帮 助 我 们 创建 数据 库 的 一 个 适 
宜 的 范式 分 解 。 
6.8 范式 


让 我 们 现在 回 到 6.5 节 不 良 数据 库 设 计 的 例子 上 ， 它 引发 出 了 其 后 两 节 中 的 数学 细节 。 我 
们 希望 创建 基于 图 6-15 中 数据 项 集合 的 一 个 数据 库 ， 并 考虑 例 6.6.3 中 国 数 依 顿 集 描述 相关 性 
规则 。 图 6-22 中 我 们 重 述 一 次 。 

我 们 从 第 一 范式 家 emp_info 开 始 ， 表 中 包含 了 所 有 这 些 数据 项 ( 参见 图 6-16 )， 并 县 注 
意 许 多 设计 问题 ， 也 就 是 异常 。 在 下 面 ， 我 们 进行 一 系列 无 损 的 表 分 解 ， 来 消 队 雇员 信息 数 
据 库 中 的 宛 余 情况 。 
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emp_id dept _name sk111_id 


emp_name dept_phone skill_name 
emp_phone dept mgrrname skill_date 
Skill_iv! 


emp_id =—» emp_name emp_pnone dept_name 
dept _name — dept _phone dept mgrname 
skill_id — skill_name 

emp_id skill_id — Skill_date skTT1_1Y1 





图 6-22 订 员 信息 数据 库 的 数据 项 和 晒 数 依 和 于 


止 如 在 定义 6.7.2 中 倍 明 的 ， 数 据 库 模式 必 数 据 库 中 所 有 表 的 标题 的 吾 从 以 及 设计 背 施 如 的 
所 有 了 遇 数 依赖 。 在 图 6-23 中 的 表 emp.info 以 太 给 出 的 函数 依赖 构成 了 这 样 一 个 数据 库 模 式 。 


i re | em | ie erry iv | 
wi je | ww os 2 | 
Ed wo lo 
ET wwaarw oa 
nr me | 0 [ecomm lo | 9 

一 


14131 OO 09-30-99 


ily emp. 1d = Emp_name emp_phone dept_name 
12) dept name 一 dept_phone dept mgrname 
13) skill _id — Skill_rame 

t41 Emp_id skill_ id — SET date skill_ivl 





图 6-23 具有 单一 表 semp_jinfe 的 雇员 信息 模 . 上 起 


1. 一 个 成 功 消除 异常 的 分 解 

在 图 6-23 中 出 现 的 一 个 异常 有 是， 如果 表 emp_info 的 某 个 雇员 的 技能 数目 变 为 零 ， 那 么 没 
有 任何 有 关 这 个 雇员 的 行 会 留 下 来 。 删 除 这 个 技能 ， 致 使 我 们 丢失 了 这 个 殿 员 的 电话 号 人 码 和 
所 在 部 门 。 在 6.5 节 的 末尾， 我们 提出 通过 使 表 emp_info 分 解 成 两 个 表 的 办 法 来 消除 这 个 异 
常 ， 也 就 是 分 解 成 表 emps 和 表 ski1l1ls, 它们 的 列 名 在 图 6-17 中 给 出 , 图 6-24 中 我 们 重复 一 志 


emp_id mp 寺 
emp_name sk1ll_id 
EMPp_phone skill_name 
dept_name skill date 
dept_phone skil?_1v] 


dept_mgrname 


{I} emp_id 一 emp_name emp_phone dept._naime 
121 dept_nanme 一 dept_ Phone dept_mgrname 
{3} skill_id 一 sktll_ndme 

14] emp_ fd SKIT id 下 skill_date skill_ivl 





图 6-24 具有 两 个 表 emps 和 skills 的 雇员 信息 模式 
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当 表 emps 和 Skill1s 最 初 被 定 交 时， 我 们 分 析 了 这 个 分 解 的 很 密 特 点 但 未 加 以 证 明 ， 弄 
在 我 们 可 以 证 明 它 们 了 。 

命题 6.8.1 上 emp_info 的 键 是 属性 集 emp id skill iaq， 这 也 是 玫 skills 的 键 ， 人 机 是 
表 emps 的 键 只 全 有 一 个 属性 emp_ ia。 

证 ”根据 定理 6.7.3 我 们 可 以 通过 找 出 一 个 属性 集合 多 ， 多 CHead(T)， 以 使 X 一 Head(T)， 
六 决定 表 T 的 - -个 超 键 . 那么 ， 为 了 说 明 集 合 % 是 一 个 键 ， 我 们 仅仅 需要 说 明 没 有 六 的 哪个 子 
集 Y 具 有 这 个 性 奈 。 图 6-23 中 任何 -个 函数 依赖 ( 重 述 如 下 ) 的 左边 属性 集合 设 为 X， 我 们 从 
查找 所 有 这 些 X 的 集合 财 包 开始 搜索 。 


il} emp_id — emp_name emp_phone dept_name 
12) dept_name — dept_ phene dept_mgrname 
13) SRKTT id =» $kill name 

人 emp_id skill_id 一 skill_date skiTtl_iv] 


从 X=erp_id skill_id 开 始 (上 面 沙 数 依赖 (4) 的 左边 )， 我们 使 用 算法 6.6.12 和 给 定 的 岗 数 依赖 集 
合 F 来 计算 XX'。 从 XX'=emp_id skill_id， 运用 函数 依 束 (4)， 我 们 得 到 X=emp_iqd skill_iqd 
skill_date Skill_jvl。 下 而 ， 使 用 函数 依赖 ， 因 为 skil1_iG 在 基 中 ， 我 们 把 skiI1_name 加 人 
到 X' 中 。 使 用 函数 依赖 (1)， 因 为 emwp_id 在 XX 中 ， 我 们 把 孙 数 依赖 (的 右边 加 人 ， 得 到 X'=emp_id 
skil] id skill date skill_ lv] skill name emp.name emp_phone dept_name。 最 后 我 们 运 
用 录 数 依赖 (2)， 因 为 dept_name 现 在 在 茎 中， 我 们 加 入 函数 依赖 (2) 的 右边 ， 得 到 X'=emp_iq 
Skill] idskill] date skiJl_lvyl skill name emp name emp_phone dept. name dept_ phone 
dept_mgrname。 这 个 最 终结 玉 包 含 了 emp_info 中 的 所 有 属性 ， 也 就 是 Head(emyp_info)。 根 据 XX 的 定 

[8.8.1] emp .id skill_id 一 Headtemp_info) 

那么 根据 定理 6.7.3，emp id skil1 id 是 emp_info 的 一 个 超 键 . 

为 了 说 明 emp_iq skil1_id 事 实 上 是 emp_info 的 一 个 键 ， 我 们 只 需要 磺 明 没有 它 的 
子 集 ( 单独 emp_ ia 或 者 ski11 ia) 函数 决定 所 有 这 些 必 性。 让 我 们 由 emp_iq 的 阿 包 来 看 
哇 些 属性 可 以 被 函数 决定 。 我 们 可 以 立即 运用 螨 数 依赖 (1) 来 得 到 emp_jidemp_iq 
emp_name emp_phone dept_name， 然 后 可 以 运用 函数 依赖 (2)， 推 导出 : 

[.8.2] emp_id 一 emp id emp_name emp_phone dept_name dept_phone dept_mgrneme 

因为 ski1l1_iaqd 不 在 [6.83.2] 的 右边 集合 中 ， 且 没有 其 他 函数 依赖 可 以 合用， 所 以 这 是 
emp_ 记 阔 数 决定 的 最 大 右边 属性 集合 。 

最 后 单独 由 集合 X 中 的 ski11_id 计 算 闭 包 ， 只 有 刻 数 依赖 (3) 可 以 使 用 。 我 们 看 到 
skil11_idqd 可 以 函数 决定 的 最 大 右边 属 人 性 集合 如 下 : 

[6.8.3)] skfTI1 id 一 skill id skKT11 name 

[6.8.2] 和 [6.8.3] 都 没有 包含 emp_info 的 所 有 属性 ， 所 以 我 们 可 以 从 [6.8.1] 得 到 结论 

[6.8.4] emp_jia skill_id 是 表 emp_info 的 一 个 键 

另外 ， 我 们 从 [6.8.3] 注 意 到 emp_id 函 数 决 定 了 图 6-24 中 表 emps 的 所 有 属性 ， 因 为 单元 素 
集 台 没有 子 集 可 以 出 现在 一 个 图 数 依 赖 的 左边 ， 所 以 : 

[8.8.5] comp_id 是 表 emps 的 一 个 键 


铝 6 车 雪 握 飞碟 计 279 


最 后 ,我们 注意 到 表 ski11s 有 ~- 些 属性 没有 被 emp_id 误 者 ski11_id 函 数 决 定 , 量 
ski11_lvi 在 [6.8.2] 和 和 [6.8.3] 的 右边 都 没有 出 现 ， 所 以 表 ski1l1ls 瞧 一 可 能 的 键 是 emp_iqd 
skill_ id。 面 

[8.8.6] emp id skill id 是 表 ski1llis 的 一 个 键 


命题 6.8.2 将 表 emp_info 划 分 成 表 emps 和 各 ski11s 的 分 解 是 一 个 直下 的 无 损 分 解 ， 


证 为 了 人 说明 这 是 一 个 有 效 的 分 解 ， 我 们 注意 到 Head(emps})U Head{(skills)= 
Head(emp_info)。 进 一 步 ，Head(temps) 中 Head(skills)=emp_id， 因 为 函数 依赖 [6.8.2] 显 
不 emp_id 一 Head(emps}， 由 定理 6.7.4 可 知 这 个 分 解 是 无 损 的 。 图 


从 命题 6.8.2 可 以 看 到 从 图 6-23 的 表 emp_info 到 图 6-24 中 表 emps 和 ski1lls 的 分 解 总 是 
允许 我 们 重新 得 到 emp_infco 的 原始 内 容 ， 只 要 连接 两 个 分 解 出 来 的 表 ， 但 是 这 个 分 解 的 真 
正 动机 是 处 理 早 些 时 候 担 到 的 种 种 异常 。 

在 6.5 节 中 提 到 的 图 6-23 中 表 emp_info 的 删除 异常 是 如 何 产 生 的 呢 ” 基 本 的 原因 是 属性 对 
emp_iqd skill_ig 形 成 了 那个 表 的 键 ，, 但 是 我 们 希望 知道 哪些 属性 被 这 两 个 属性 中 的 
emp_ i 半数 决定 。 如 果 我 们 删除 对 于 某 个 emp_iqd 的 最 后 一 个 ski11_id 值 ， 我 们 将 不 再 有 与 
这 个 emp_id 对 应 的 [emp_iqd ski1ll1_ig) 对 ,但 是 我 们 仍然 有 只 决定 十 emp_igd 的 信息 ,那些 
是 我 们 椒 希 望 玉 失 的 ! 用 E-R 模 型 来 说 ，empLoyees 是 真实 的 实体 ， 它 的 属性 是 我 们 想 知 晓 的 
(所 以 舱 员 标识 待 emPp_ia 在 一 个 函数 依赖 的 左边 出 现 )。 在 图 6-24 的 分 解 中 ， 我 们 从 志 
emp_imto 分 解 出 表 emps 以 使 我 们 在 这 种 方法 中 不 会 入 失信 息 。 根 据 这 个 新 的 模式 ， 我 们 可 以 
在 表 emps 中 为 一 个 给 定 的 和 雇员 保留 - 行 ， 即 使 这 个 雇员 没有 任何 技能 。 回 忆 前 面 提 到 插入 异常 
是 删除 异常 的 相反 庙 。 所 以 插入 一 个 新 的 没有 技能 的 雇员 (一 个 实习 生 ) 到 表 emp_info 中 变 
得 不 可 能 。 正 如 前 面 所 述 ， 这 个 问题 通过 分 解 出 表 emps 来 解决 ， 因 为 一 个 新 的 行 可 以 插入 到 
emps 中 ， 该 行 与 表 ski11s 中 的 任何 一 行 没 有 连接 。 至 于 更 新 异常 ， 这 个 问题 在 表 emp_info 
中 再 次 出 现 ， 因 为 仅仅 依赖 于 emp_iad 的 属性 存在 于 键 居 emp_iq ski11_id 的 表 中 ; 所 以 ， 
我 们 可 能 在 这 个 表 中 有 带 有 相同 的 雇员 电话 号 码 的 多 行 ， 必 须 全 部 同时 更 新 ， 再 强调 -次 ,分 
解 出 表 emps 解 决 了 这 个 问题 ， 因 为 每 一 个 雇员 现在 由 单一 行 代 表 了 了 。 

现在 的 问题 是 : 在 图 6-24 的 数据 库 模 式 中 ， 还 有 更 多 异常 存在 吗 ? 回答 是 崩 定 的 ， 这 可 
能 并 不 令 人 惊 过 。 述 存在 另 一 种 异常 ， 如 同 我 们 刚刚 在 表 ski11s 中 分 析 的 - 这 个 表 有 一 个 二 
键 (ski11_iq emp_id)， 我 们 回忆 图 6-22 的 函数 依赖 (3): 

[6B.8.7) kil]_id 一 skill_name 
这 个 录 数 依赖 似乎 在 说 ，ski11s 本 电 是 一 个 实体 ，skil1l_id 是 这 个 实体 的 一 个 标识 科 ， 
skil1l_name 是 :个 描述 符 . ( 可 能 存在 两 个 不 同 的 技能 具有 不 同 的 ski11_id 值 但 是 有 相同 
的 skili_name, 因为 ski11 name 一 skil11_igd 不 能 从 我 们 的 函数 依赖 列表 推导 出 . } 介 是 ， 
我 们 已 经 确定 表 skil1lsg 的 键 是 emp_iq skil1l_iq,。 这 伺 乎 与 我 们 从 emp_info 中 分 解 出 
emps 的 情况 是 对 称 的 。 我 们 能 够 构造 { 树 如 ) 一 个 导 玫 这 一 步 的 删除 异常 吗 * 回答 荐 可 以 ， 
因为 如 打假 设 某 种 技能 很 少 扣 上 且 不 易 掌 担 ， 同 时 我 们 罕 然 失去 了 最 后 一 个 掌握 这 种 技能 的 雇 
员 ， 那么 我 们 将 根本 不 再 有 这 种 技能 的 任何 信息 了 ， 既 没有 ski11_igd 也 没有 skill_name。 
那么 ， 我 们 需要 分 解 出 一 个 表 来 解决 这 个 异常 ， 在 图 6-25 中 可 以 看 到 结果 。 

通过 检查 图 6-25 中 新 的 表 emp_ski1lls 和 和 表 skills， 可 以 清楚 地 看 到 这 两 个 表 构 成 了 图 
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6-24 中 表 skil1l1s 的 一 个 无 损 分 解 。 事 实 上 ， 图 6-25 中 的 三 个 表 榴 成 了 开始 时 图 6-23 中 表 
emp_info 的 一 个 无 损 分 解 。 最 为 重要 的 是 ,我 们 已 经 处 理 了 那些 因为 要 保留 实体 skitls 的 
属性 而 产生 的 异常 ， 这 个 ski11s 实 体 在 一 个 表 中 描述 ， 该 表 的 键 具 有 两 个 属性 。 按 照 E-R 模 
型 的 概念 ， 我 们 财团 所 司 的 就 是 从 两 个 实体 Emps 和 Ski1lls 中 分 解 出 联系 emp_skillsg。 

坝 在 考虑 图 6-25 的 三 个 表 。 在 表 emps 的 每 一 项 ， 如 同 在 命题 6.8.1 中 显示 的 ， 被 单一 属性 
emp_id 了 半数 决定 ， 表 skti11ls 有 类 似 的 形式 ， 如 同 我 们 在 [6.8.7] 的 函数 依赖 中 看 到 的 ; 在 表 
emP_skil1s 中 ， 看 一 下 [6.8.2] 和 f{6.8.3] 可 以 并 清楚 在 这 个 表 中 不 再 剩 下 什么 属性 依赖 于 键 
(emp_iqd skil1_ig) 的 某 个 子 集 。 那 么 我 们 疝 在 这 些 表 中 是 否 还 存在 进 -- 步 的 异常 ? 再 一 
次 问答 存在 ! 为 了 看 出 这 是 为 什么 、 考 虑 如 果 我 们 的 公司 中 进行 一 次 大 的 收编 将 发 生 什 么 事 
倩 : 在 一 个 部 门 中 的 每 一 个 雇员 将 调动 到 其 他 部 门 中 【甚至 经 理 也 将 被 调动 ， 假 设 以 后 在 这 
个 刚 被 誉 空 的 部 门 中 将 会 有 其 他 雇员 来 代替 他 们 的 职位 )。 现 在 注意 到 当 最 后 一 个 雇员 被 去 除 
时 ， 在 表 emps 中 将 不 青 有 任何 行 包 会 关于 这 个 部 门 的 信息 : 我 们 甚至 已 经 丢失 了 部 门 电话 号 
人 码 和 它 的 和 名字! 这 个 问题 的 解决 办 法 显而易见 : 我们 必须 为 部 门 分 解 出 - -个 单独 的 表 。 这 将 
导致 图 6-26 的 emp_info 数 据 库 ; 这 个 数据 库 满 足 第 二 范式 (3NF )。 在 这 个 例子 中 ， 同 时 等 
价 地 满足 Boyce-Codd 范 式 (BCNEF )， 稍 后 我 们 将 给 出 这 些 范式 的 定义 。 


emp_sKk111s ski1lls 


emp_id 忆 W 户 ii 了 志 KK111_ 二 志 
emp_name ski1i11_ fd ki 1 nafine 


emp_Pphone skill_date 


dept rame skill 1vl 


dept, phone 


dept_mgrname 


ly emp_id — emp_rame emp_Pphone dept_name 
‘2 dept_name = dept, phone dept_myrname 
43 skt1ll_id -» skill_name 

(二 emp_1d skilt ,id — skilt_date skill_ivi 





图 6-25 具有 三 个 表 的 雇员 信息 模式 
得 到 图 6-26 中 表 depts 的 分 解 后 ,与 部 门 信 息 相 关联 的 更 新 异常 将 不 再 困扰 我 们 。 用 E-R 模 
型 术语 来 说 ， 我 们 所 做 的 工作 就 是 区 分 两 个 实体 Emps 和 Depts 以 及 两 者 之 问 的 一 个 多 对 一 联系 
( 表现 为 表 emps 中 的 外 键 dept_name )， 


emp id dept_name emp_id ski11_1d 
emp name dept phorne sk111 fd Skill name 
pmp_phone Ee rE skd11_ date 

dept_name skdll 1wvl 


ty emp_id + emp_name emp_phone dept_name 
i2; dept_name — dept_phone dept_myrname 


Il skill_id — skill_name 
tA emp_1d SATT_ 1 3 SkKITT_date Skill Tv 


图 6-26 符合 3NF (也 符合 BCNF ) 的 雇员 信息 数据 库 横 式 
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在 这 里 ， 我 们 宣称 图 6-26 的 数据 库 模 式 在 某 种 意义 上 是 .… 个 最 终结 果 - 一 个 再 有 异 遂 困扰 
我 们 。 为 了 明 占 验证 这 个 陈述 的 基本 原理 ， 我 们 看 看 四 个 在 数据 库 中 必须 保持 的 上 男 数 依赖 ， 
在 下 面 表 示 成 函数 依赖 集 F。 先 前 模式 中 我 们 已 经 提出 的 种 种 异常 情况 ， 其 根本 原因 已 经 呈现 
出 来 : F 中 的 一 个 蝗 数 依赖 的 左边 的 某 个 属性 (在 不 同 的 模式 中 它 可 能 是 属性 集合 ) 在 它 出 现 
的 表 中 可 能 多 次 重复 出 现 (也 可 能 出 现 零 次 )。 解 决 办 法 是 创建 一 个 单独 的 表 ， 把 这 个 函数 依 
赖 左边 的 属性 以 及 所 有 外 十 右边 的 所 有 属性 放 和 人 其中， 同时 把 右边 的 属性 从 它们 先前 出 现 的 
志 中 除去 。 仔 细 地 顺 次 观察 图 6-23 到 图 6-26 的 分 解 ， 可 以 看 出 这 和 是 对 已 令 工 作 的 一 个 正确 描 
述 。 因 为 这 个 函数 依赖 左边 的 属性 在 兰 的 和 新 的 表 中 都 出 现 ， 而 且 决 定 所 有 新 表 中 的 其 他 属 
性 ， 所 以 这 个 分 解 是 无 损 的 。 因 此 ， 末 数 依赖 (1 产生 了 表 emps ， 郴 数 依 赖 (2)] 产 千 了 表 
aspts， 函 数 依赖 (3) 产 生 了 表 skil11s， 范 数 依 赖 (4) 产 生 了 和 表 emp_skills。 因为 在 F 中 不 
上 骨 有 其 他 函数 依赖 ， 所 以 我 们 保证 没有 其 他 异常 会 产生 ， 不 再 需要 进 一 - 步 分 解 。 这 样 ， 我 们 
得 到 了 最 终 形式 ， 

2. 范式 : BCNF、3NF 和 2NF 

在 图 6-26 的 最 终 模 式 中 ， 每 一 个 表 有 唯 - :的 候选 键 ， 我们 把 它 看 做 这 些 表 的 主键 为 什 
和 不 需要 做 进一步 的 分 解 来 表达 这 些 才 中 异常 呢 ? 一 个 刻画 该 问题 的 方法 趾 剖 明 所 有 只 涉及 
这 个 模式 中 单个 表 的 属性 的 孙 数 依 焙 只 源 自 该 表 的 键 。 下 面 提 殿 定 义 来 使 这 个 方法 精确 化 。 

定义 6.8.3 ”给 定 一 个 数据 库 模 式 和 一 个 通用 表 T 以 及 栈 数 依赖 集 F， 令 {T,,T,…,T,} 是 T 的 
-个 无 损 分 解 ， 那 么 对 于 F 的 一 个 函数 依赖 X 一 Y， 如 果 对 分 解 中 的 某 一 个 表 T,， 有 XXUY 二 
Head(T)， 赔 称 该 函数 依赖 在 T 的 分 解 中 被 保持 ， 或 者 说 ，T 的 分 解 保持 了 函数 依赖 X->Y。 此 
时 ， 我 们 也 说 函数 依 闵 X 一 Y “在 T 被 保持 ”"， 或 者 说 “存在 于 T, 中 ”或 者 “在 T, 中 ”， 国 

例 6.8.1 ”对 于 图 6-23 中 的 通用 表 以 及 函数 依赖 集 F 构 成 的 雇员 信息 模式 ， 我们 已 经 顺 次 推 
导出 许多 分 解 : 两 个 表 的 分 解 (图 6-24 ) 三 个 表 的 分 解 《 图 6-25 ) 和 四 个 表 的 分 解 ( 图 6-26 )。 
每 一 种 分 解 都 保持 F 中 的 所 有 函数 人 依赖。 例如， 在 图 6-26 四 个 表 的 分 解 中 ， 函 数 依 赖 (1) 存 在 于 
表 emps 中 ， 了 薄 数 依赖 (2) 存 在 于 表 depts 中 ， 了 丽 数 依赖 (3) 存 存 于 表 ski1l1s 中 ， 函 数 依 束 (4) 
存在 二 表 emp_ ski11s 中 ，. 国 

因为 FE 中 的 每 一 个 疯 数 依赖 在 加 6-26 四 个 表 中 的 : -个 中 保持 ， 所 以 无 论 何 时 模式 中 的 一 个 
表 被 更 新 ， 都 可 以 验证 任何 被 这 个 更 新 影响 的 函数 依赖 仍然 有 效 。 可 以 通过 在 那个 表 中 检验 化 
的 有 效 性 来 验证 ， 而 不 需要 连接 操作 。 这 是 在 一 个 分 解 中 为 保持 函数 依赖 而 进行 探求 的 动机 ， 

定义 6.8.4 Boyce-Codd 范 式 ( 修正 的 第 三 范式 】 当下 面 性 质 成 立时 ， 一 个 数据 库 模 式 
中 的 表 T 及 函数 依赖 集 F 被 称 为 符合 Boyce-Codd 范 式 { BCNF ): 任何 F 可 推 圣 出 的 函数 依赖 X 
一 A 都 在 T 中 ， 这 里 A 是 淋 在 X 中 的 单 属性，X 必 须 是 IT 的 - -个 超 键 。 当 -个 数据 库 模 式 包 合 
的 所 有 - 专 都 符合 BCNE 时 ， 这 个 数据 库 被 称 为 符合 BCNF。 图 

考虑 表 T， 今 六 一 A 是 T 的 :一 个 阴 数 依赖 。 如 果 BCNF 性 质 在 此 成 立 ， 那 么 叉 是 一 个 超 键 ， 
所 以 对 于 表示 T 的 键 的 某 个 集合 K， 有 开 忆 X。( 注意 ， 可 能 有 很 多 不 同 的 集合 K,，K;，……* 部 
是 T 的 候选 键 ， 如 同 我 们 在 下 面 例 6.8.4 中 考虑 的 。 ) 如 果 BCNF 性 质 不 成 立 ， 那 么 X 不 包 富 键 属 
性 的 集合 K， 对 所 有 K，K - X 是 非 空 的 。 这 里 可 能 存在 其 种 情况 : 或 者 (1) XX- 对 某 个 KK 是 
空 的 ， 即 久 CKK。 我们 说 T 的 -- 些 属性 被 键 K 的 一 个 合适 的 子 集 X 函 数 决 定 ; 或 者 (2) 对 所 有 
K，XX -KK 是 非 空 的 。 那么 一 些 属性 被 集合 X 决 定 ， 对 于 每 ~: 个 K，X 都 至 少 有 部 分 属性 不 在 K 
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中 。 在 第 二 个 情况 中 ， 我 们 说 T 的 一 些 属 性 被 一 个 不 同 的 属性 集 台 【 它 不 包 合 任 何 键 集 合 ， 也 
不 被 任何 键 集 合 包含 ) 函数 决定 。 

例 6.8.2 在 图 6-26 的 表 emp_ski1is 中 ， 唯 一 的 键 是 emp_iqd skill_iq， 我 们 可 以 通 
过 讨论 集合 闭 包 很 容易 地 证 明 这 一 点 : 任何 函数 决定 表 emp_ski1lls 的 所 有 属性 的 属性 集合 
必然 包 会 这 两 个 属 件 。 我 们 宣称 这 个 家 符 合 BCNF 并 将 在 下 一 个 例子 中 证 明 。 正 如 我 们 刚 指出 
的 ， 定 义 6.8.4 的 BCNF 性 质 意 味 着 这 个 表 没 有 属性 被 这 个 键 集 合 的 任何 了 和 集 或 者 任何 不 包含 这 
个 键 集 合 的 相同 属性 集合 图 数 决 定 。 

在 图 6-24 的 表 skil1ls 中 ， 叭 一 的 键 是 emp_iqd skill 1da， 而 函数 依赖 ski11 iq 
skill_name 也 存在 于 这 个 表 中 。 显 然 ， 这 个 函数 依赖 的 左边 是 键 emp_id skil11_iqd 的 一 个 
子 集 。 因 池 ，BCNF 人 性 质 对 这 个 下 不 成 立 (我 们 曾 指出 一 旦 一 个 异常 产 千 ， 我 们 就 进行 进一步 
分 解 )。 

在 图 6-24 的 表 emps 中 (与 赂 6-25 的 表 emps 相 同 )， 唯 一 的 键 包含 属性 smP_1a， 而 郴 数 
依赖 sept_nmname 一 aept_Pphone 是 由 F 的 函数 依赖 (2) 推 导 的 且 在 这 个 表 中 存在 。 既 然 这 个 责 
数 依赖 的 左边 与 键 集 合 不 同 《 即 不 是 子 集 也 不 是 超 集 )， 那 么 不 满足 BCNF 性 质 ， 需 要 进一步 
分 解 。 注 意 ， 通过 这 个 方法 ,一 个 包含 smps 的 gaept_Phoene 以 外 所 有 其 他 属性 的 表 emps2 仍 
然 丰 遵守 BCNEF 性 质 ， 尽 管 图 数 依 顿 dept_nmname 一 aept_phone 不 存在 于 表 emps2 中 ， 但 是 
同样 由 函数 依赖 (2) 推 导出 的 范 数 依赖 dept_name 一 dept_mgrname 却 存在 于 emps2 中 。 国 


例 6.8.3 ”我 们 宣称 图 6-26 的 数据 库 模 式 是 符合 BCNF 的 。 我 们 铝 要 说 明 如 时 任意 由 F 推 导 
册 的 画 数 依赖 X 一 A 丫 在 于 图 6-26 的 一 个 表 中 (这 里 A 是 一 个 不 在 和 中 的 属性 }， 那 么 % 包 含 该 
表 的 - -个 键 。 我 们 已 经 在 例 6.8.1 中 说 明 对 于 图 6-26 的 表 集 侣 ，F 的 一 个 是 数 依 赖 存 在 于 一 个 表 
中 ， 而 且 这 个 明 数 依赖 的 左边 是 这 个 表 的 键 。 然而 这 并 术 彻 底 解决 问 题 ， 因 为 我 们 还 需要 考 
谍 所 有 被 F 克 涵 的 函数 依赖 ， 那 就 是 所 有 在 这 个 模式 中 为 真 的 函数 依赖 。 对 于 命题 6.8.1 中 的 孙 
数 依 束 [6.8.1] ，[6.8.2] 和 [6.8.3}， 我 们 计算 了 F 的 这 三 个 函数 依赖 左边 属性 集合 的 闭 包 ， 说 明 
这 三 个 集合 构成 了 三 个 表 的 键 。 对 于 第 四 个 表 ， 我 们 只 需要 计算 aept_name 的 闭 包 ， 得 到 
dept_name dept_ phone dept mgrname, 好 Head idepts}: 

[6.8.8} dept_name 一 Headtdepts} 

现在 我 们 宣称 不 包含 这 些 X 集 合 (FF 中 一 个 函数 依赖 的 左边 ， 辣 时 是 向 6-26 中 某 个 表 的 键 ) 
中 任 一 个 的 所 有 属性 集 Z， 必 然 有 平凡 闭 包 Z =Z。 因 为 没有 X 一 YY 形式 的 图 数 依赖 存在 X 所 并， 
同时 由 算法 6.6.12， 没 有 属性 将 被 加 入 到 2Z 的 集合 团 包 中 ， 所 以 可 以 得 出 上 面 结 论 。 

由 此 ， 我们 可 以 容易 地 看 到 图 6-26 中 的 所 有 表 符 合 BCNF， 因 为 如 果 X 一 A 成 六，A 是 一 个 
不 被 包含 在 属性 集 X 中 的 属性 ， 那 么 X 一 AX， 所 以 X 不同 于 其 。 但 是 我 们 已 经 说 明 任 何不 包 合 
表 键 的 属性 集 有 一 个 平凡 团 包 ， 这 一 定 意味 着 XX 包含 某 个 键 K。 在 那个 表 中 ， 我 们 同样 已 经 包 
合 了 被 K 函 数 决 定 的 所 有 属性 ， 所 以 A 也 在 那个 表 中 。 国 

例 6.8.4 假设 我 们 改变 雇员 信息 数据 库 中 的 规则 ， 使 aept_mgrname 是 实体 
Depatments 的 第 二 个 标识 符 ， 与 aept_name 的 作用 相当 。 这 将 在 集合 FE 中 加 人 一 个 新 的 范 
数 依 赖 dept_morname 一 dept_name; 根据 传递 性 ， 因 为 dept_name 是 图 6-26 表 depts 的 
一 个 键 ， 所 以 dept_mgrname 也 是 一 个 键 。 现在 问题 是 表 depts 星 否 傅 然 层 BCNF 的 。 回 管 
是 肯定 的 ， 因 为 BCNF 性 质 并 不 要 求 表 有 唯一 一 个 键 。 在 表 aepts 中 改变 的 唯一 内 容 是 现在 有 
两 个 键 ， 但 是 这 个 表 中 任何 X 一 Y 形 式 的 困 数 依赖 具有 必需 的 性 质 ， 即 X 人 包含 aept_mgrname 
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或 者 站 包含 dept_name。 图 

F 中 的 每 个 冰 数 依赖 企图 6-26 的 --… 个 表 中 存在 ， 所 以 盛 论 何 时 模式 中 的 一 个 表 被 由 新 部 
可 以 验证 被 涉及 的 妆 数 依赖 们 然 戌 立 ， 这 可 以 通过 只 检查 这 一 个 表 的 数据 项 来 确定 我 们 希 
乌 总 可 以 从 一 个 通用 表 开 始 进行 无 损 分解 到 满足 BCNF 来 保证 孙 数 依赖 的 保持 。 不 率 的 是 ， 这 
不 成 立 ， 因 为 “个 下 的 BCNF 标 淮 太 严格 了 。 

例 6.8.5 我们 希望 加 入 很 多 属性 到 图 6-22 的 雇员 信息 数据 库 中 ， 以 知 虹 所 有 雇员 的 完整 
地 址 {假设 生活 在 美国); 

emp_cityst, emp_straddr, emp zip 

这 里 ，emp_cityst 肥 映 了 城市 和 州 ，emp_zip 是 邮政 编 磺 ， emp_stLraddr 是 街道 名、 
号 码 和 启 所 。 我 们 发 现 当 到 达 疼 6-26 的 分 解 时 ， 表 emps 包 含 了 所 有 这 些 必 性 (除了 已 右 的 属 
忻 )， 参 所 图 6-27。 

我 们 假设 每 个 座 员 被 要 求 提供 一 个 地 址 ， 显 然 emp_id 阴 数 决 室 了 所 有 这 些 新 的 属性 ， 梢 
获 依 顿 (1 相应 修改 成 : 


(1 emp_id 一 emp_name emp Phone dept name emp straddr emp_cityst emp_z21p 
图 6-26 中 任何 表 的 键 都 没有 被 影响 ， 表 emps 的 键 仍然 是 emp_id. 


empadds 





emp._id emp cityst 








写作 DD_i 昱 


emp Name emp_ straddr 





， 昌 由 PpP_name 

emp _phone emp_phone emp-zp 
; dept name dept name 

: emp cityst emp ctyst 





; emp straddr emp_ straddr 






emp_zip 


图 6-27 被 扩展 的 包含 雇员 地 址 的 emps 表 赂 6-28 图 6-27 的 -个 3NF 分 解 

但 是 邮局 已 经 给 城市 的 区 域 分 具 了 邮政 编码 (由 街道 地 址 决定 ) 并 吓 椒 交 羡 城市 边界 ， 
所 以 我 们 也 有 下 面 这 些 新 函数 依赖 加 入 到 集合 F 中 ， 

15] emp_cityst emp_straddr 3 emp.z1ip 城市 区 域 决 定 邮 玻 编 码 

(6) emp zip 一 emp_cityst 邮政 编码 始终 不 交叉 城市 边 挫 

因为 函数 依 球 (5) 的 左边 emp_cityst emp_straddr 椒 是 emps 上 家 的 -个 超 键 ， 所 以 我 
们 需要 进步 分 解 以 获得 BCNE 性 质 。 如 果 我 们 没有 做 这 -- 步 并 且 有 删除 了 在 某 一 个 邮 卜 编码 中 
的 最 后 一 个 雇员 ， 我 们 将 丢失 关于 那个 邮政 编码 的 信息 ， 也 就 是 与 它 相 关联 的 城市 和 州 . 按 
照 在 图 6-26 上 后面 讨论 中 解释 的 命题 ， 我 们 将 昂 数 依赖 (5) 丰 边 的 属性 以 及 这 个 昭 数 依 环 石 边 的 
所 有 属性 添加 到 一 个 单独 的 表 empadas 中 ， 而 把 右边 的 属性 从 原 先 它 们 所 在 的 表 (emps) 中 
除去 。 在 图 6-28 中 显示 结果 。 这 是 先前 表 的 一 个 完全 合理 的 无 损 分 解 (无损 是 根据 定理 6.7.4 
得 到 的 ， 因 为 emp_cityst emp_straddr 是 empadas 的 : :个 键 ， 同 时 也 是 两 个 表 标 题 的 
交集 )。 我 们 也 注意 钊 emp_zip emp_straddr 是 表 empadqs 的 男 一 -个 候选 键 ， 因为 if 算 这 
个 集合 的 闭 包 时 我 们 由 晴 数 依赖 (而 得 到 了 emp_cityst。 所 以 我 们 推导 出 新 的 函数 依赖 (7)。 
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很 窜 易 从 闭 包 中 看 出 empadag 没 有 其 他 候选 键 存 在 。 
(7 emp_zip emp_straddr — emp_cityst 由 L516 推导 出 的 培 数 依 正 


图 6-28 的 表 emps 现 在 满足 BCNF， 因 为 少数 依赖 (5) 和 (6) 都 不 存在 填 emps 中 ， 间 时 队 一 
剩 下 的 函数 依赖 () 要 求 对 于 这 个 表 的 任何 超 键 吏 包含 emp_ia。 这 个 分 解 也 保持 硝 数 依赖 (5) 
和 (6)1， 它 们 都 完全 存在 于 表 empaads 中 。 然 而 ， 这 里 郴 数 依赖 (的 强迫 我 们 对 表 empadds 进 
行进 -一 步 的 分 解 以 省 得 BCNF 性 质 ， 因 为 emp_ zip 一 emp_citvektr， 和 而 且 emp_ zip 不 和 包 舍 
embadds 的 两 候选 键 之 一 ， 明 显 ， 这 个 新 的 分 解 在 每 一 个 表 中 -- 和 定 最 多 包含 两 个 属性 ， 我 们 
要 求 ( 图 6-29 的 zipcit ) 一 个 具有 标题 emp_zip emp_cityst 的 表 来 包含 函数 依 下 (6)。 
男 一 个 表 只 有 两 个 可 能 的 属性 对 作为 标题 ， 即 国 数 依赖 (5) 或 者 国 数 依赖 (7 的 左边 ， 二 者 都 是 
表 empadas 的 键 。 选 择 函 数 依 赖 (5) 的 左边 ，emp_cityst emp_straddr 将 不 能 够 得 到 --- 
个 力 损 分 解 ， 国 为 它 与 zipcit 了 唯一 共有 的 属性 是 emp_citcysc， 而 这 不 包含 两 表 中 任何 一 
个 的 键 ， 所 以 我 们 选择 图 6-29 中 的 BCNE 分 解 。 


emp_id emp zip emp_zip 
emp_name emp_ straddr emp_tityst 
emMb_pPhone 


dept name 


emp cityst 


emp_straddr 





图 6-29 图 6-28 的 -一 个 BCNF 分 艇 


研 6-29 的 分 解 是 刺 损 的 ， 原 因 如 下 : emp_zip 古 表 zipcitr 的 键 ， 足 HeadlziPstr) 和 
Headtzipeit 的 交 洁 ， 所 以 这 个 连接 是 无 损 的 ;zipett 和 zipeit 标 题 的 并 集 包 含 表 
embadas 的 所 有 属性 ， 所 以 zipstr 和 zipcit 连 接 后 构成 网 6-28 中 表 empaads; 表 
empadds 和 emps 构 成 一 个 无 损 连 接 ， 所 以 这 三 个 表 的 连接 是 无 损 的 ， 进 --- 步 ， 图 629 的 现 个 
新 表 都 满足 BCNF 范 式 。 表 zipcit 的 瞧 一 末 煞 依 天 是 一 数 依 理 (6)， 击 有 卫 emp_zip 是 键 ， 
zipstr 中 设 有 国 数 依赖 ， 所 以 队 一 的 键 包 含 丙 个 属性 emp_zip emp_straddr， 它 也 是 图 
6-28 中 表 empadds 的 一 个 候选 键 . 

但 是 图 6-29 的 分 解 不 保持 扩展 的 集合 F 的 依赖 ， 因 为 奖 数 依赖 (5) 不 在 两 表 之 一 中 存在， 这 
会 产生 一 -个 不 幸 的 结果 ， 我 们 必须 进行 程序 性 检查 以 确保 输入 的 给 定 街 道 地 址 、 城 市 、 州 和 
邮政 编码 与 邮局 的 分 配 相 符合 。 者 

如 果 我 们 是 起 保持 医 数 依 顿 ， 那 么 我们 似乎 在 分 解 上 已 经 走 的 太 远 了 -. 我 们 所 期 望 的 是 
对 范式 的 一 个 定义 ， 以 使 我 们 在 图 6-28 停 止 而 不 继续 记 图 6-29。 为 些 ， 我 们 必须 提出 范式 的 
一 个 新 定 交 【也 就 是 3NEF )。 

定义 6.8.5 主格 性 { Prime Attribute ) ”在 表 T 中 ， 一 个 属性 A 称 为 是 主 属性 当量 仅 当 属 
性 A 存在 于 这 个 表 的 某 个 键 K 中 。 | 

定义 6.8.6 第 三 范式 {Third Normal Form 】 ” 当 数 据 库 模 式 的 表 T 以 及 消 数 依赖 集 F 清 
足下 面条 件 时 ， 被 称 为 符合 第 二 范式 【3NEF ): 对 任何 出 F 推 导 并 存在 于 表 T 中 的 函数 依赖 XX 一 
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和 (这 蛙 A 是 单个 属性 日 不 在 X 中 })， 上 面 典 个 性 质 之 一 必须 成 立 , 或 者 (1) XX% 是 T 的 一 个 起 键 ， 
或 者 (2) A 是 T 的 - -个 主 属性 。 当 -个 数据 库 模 式 包 含 的 所 有 表 符合 3NF 时 ， 这 个 数据 库 模式 
称 为 行 合 3NF. 国 

例 6.8.6 考虑 图 6-29 的 数据 库 模 式 。 基 中 的 每 一 个 表 部 符 台 BCNF， 所 以 这 个 模式 也 符合 
3NF。BCNF 业 求 一 个 表 具 有 3NF 定 尺 的 性 质 ( 1)， 市 不 允许 性 质 (2) 的 “逃脱 子 句 ”"。 所 以 
任何 BCNF 的 表 也 是 符合 3NF 的 , 但 反之 不 然 。 | 

例 6.8.7 考虑 图 6-28 的 表 empadds， 这 个 表 是 3NF 代 不 是 BCNF 的 。 我 们 需要 对 这 个 表 进 
一 步 分 解 的 原因 是 图 6-28 的 表 empadds 有 -- 个 键 emp_cityst emp_straad， 同 岂 关 数 依 
赖 (6) emp_zip-remp_eitystr 存 在 十 这 个 表 中 。 这 个 函数 依 穆 的 左边 不 包含 empadds 的 键 ， 
所 以 它 不 满 息 BCNF 性 质 。 然 而， 我 们 注意 到 这 个 函数 依赖 的 右边 的 属 件 存在 于 某 个 键 中 ， 所 
以 它 星 主 上 览 属 性 。 因 此 这 个 函数 依赖 满足 3NF 定 义 的 性 质 (2 ).。 田 

例 6.8.8 给 定 表 T，Head(T)=A B CD， 明 数 人 依赖 集 F 如 下 : 

F: {1} A B20C D, {2) DB 

显然 ，A B 是 T 的 一 个 修 选 和 键 ， 我 们 由 闲 包 看 到 A D 是 另 一 个 候选 键 : A D':=A DB (2)C 
(1),， 很 容易 确认 没有 其 他 候选 键 。 现 在 表 T 己 经 是 3NF 的 ， 国 为 由 F 推 导 的 不 包含 &A B 在 左边 
(所 区 不 是 平凡 的 ) 的 唯一 尚 数 依赖 决定 于 明 数 依 束 (2) D 一 B， 月 因为 B 是 一 个 主 属 性 ， 所 以 
肯 T 满 足 性 质 (2) 的 “和 逃脱 子 句 "， 它 是 符 澡 3NF 的 ， 

如 果 我 们 确实 和 希望 把 TIT 无 损 地 分 解 成 BCNF 范 式 , 我 们 从 投影 到 包 侣 明 数 依赖 (2) 的 表 开 始 ， 
也 就 是 表 T;，Head(T;)=B D。 姥 么 我 们 想 使 表 T, 包 含 T 的 -- 个 候选 键 和 属性 C。 但 是 如 果 我 们 
创建 表 T,， 使 Head(T)=A B C, 那么 T, 和 T, 的 标题 的 交集 将 个 包含 D， 所 以 连接 不 是 无 执 的 。 
因此 ， 我 们 必须 创建 表 T,， 使 Head(T,))=A D C， 部 么 我 们 就 有 了 BCNEF 分 解 {A DC,B D}。 国 


住 分解 具 有 给 定 汕 数 依赖 集 F 的 数据 库 以 获得 范式 的 时 候 ，BCNF 和 3NF 范 式 遂 常 是 相亲 
的 ， 和 如同 我 们 在 例 6.8.6 中 看 到 的 。 见 有 当 存 在 两 个 F 推 呈 的 非 平 几 清 数 依 带 X 一 Y 和 ZZ-+B， 其 
中 ZC 记 XUY 有 Be 义 时 ， 它 们 才 不 相同 ,在 例 6.8.8 中 ， 霄 数 依 赖 {1) A B >C 了 DD 和 函数 依赖 (2) 
D 一 B， 其 中 DCCDEB ee AB， 为 取得 BCNF 而 进行 的 进一步 分 解 将 导致 依赖 不 再 被 保持 。 入 
多 数据 库 设计 者 以 保持 依赖 的 3NF 设 计 为 目标 。 

表 性 质 的 另 一 个 定 兴 ， 第 二 范式 (second normal form，2NF. ) 比 3NF 噶 。 它 是 过 时 的 东 
西 ， 因 为 在 椒 达 到 3NF 时 停止 没有 什么 好 处 。 从 定义 6.8.6 我 们 看 到 当 -个 表 不 能 成 为 3NF 时 ， 
它 一 定 合 有 一 个 有 效 的 非 平 凡 函 数 依赖 X 一 A， 这 早 A 是 非 主 属性 上 且 XX 不 是 T 的 -- 个 赵 刍 回忆 
在 定义 6.8.4 后 面 对 BCNF 的 讨论 ， 如 果 六 不 是 T 的 一 个 超 键 ,那么 可 能 右 两 种 情况 : 或 者 对 某 
个 KK 有 及 己 K， 我 们 说 T 的 一 些 属性 被 键 K 的 某 个 适当 子 集 XX 孙 数 梁 定 ; 或 者 X -及 对 T 中 所 有 键 
有 都 是 非 空 的 ， 我 们 说 T 的 一 些 属 性 函数 决定 于 一 个 不 同 的 属性 集合 ， 这 个 集合 不 包 含 任 何 键 
集合 也 不 被 任何 键 集 台 和 包含 。 后 一 种 情况 也 被 称 为 传递 依 球 ， 因 为 对 任何 键入 我 们 有 于 一 和 ， 
旦 给 定 X 一 A， 所 以 函数 依赖 K 一 A 可 以 由 传递 性 推 时 出来。 一 个 2NF 的 表 不 允许 有 被 键 K 的 真 
子 集 函 数 决 定 的 属性 ， 但 可 能 仍然 有 传递 依赖 。 


定义 6.8.7 第 二 范式 数据 库 模 式 中 的 表 T 以 及 函数 依赖 集 F 被 称 为 满足 第 二 范式 (2NF )， 
需要 满足 店面 条 件 : 对 存在 于 T 中 由 F 排 导 的 任何 函 煞 依赖 和 一 A ( 这 里 入 是 一 个 不 在 XX 中 的 单 
一 属性 而 且 是 非 主 属性 )，X 不 是 T 的 任何 键 K 的 真 拖 集 。 当 一 个 数据 库 模 式 包 含 的 所 有 表 都 符 
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合 2NFHj ， 这 个 数据 库 模 式 称 为 符合 2NF， 国 
例 6.8.9 图 6-25 的 数据 库 模 式 是 2NF 的 。 它 的 证 明和 留 作 本 这 未 尾 的 习题 。 国 


3. 获得 良好 3NF 分 解 的 一 个 站 法 

因为 很 多 贰 林原 因 ， 看 起 来 顺 次 分 解 来 获得 保皇 国 数 依赖 的 3NF 无 损 连 搂 分 解 的 方法 是 不 
锌 很 区 实战 人 员 信 任 的 。 这 乓 我 们 昂 到 的 是 唯一 方法 ， 在 图 6-23 到 6-26 中 使 用 。 因 为 在 顺 次 
分 解 中 使 用 的 函数 依赖 集 F 没 有 被 兴 真 地 定义 ， 所 以 问题 会 发 生 ， 如 同 我 们 在 6.6 节 中 看 到 的 ， 
可 能 有 很 多 的 等 价 集合 F。 算法 6.8.8 提 供 了 一 种 直观 的 方法 来 创建 所 需要 的 分 解 。 


算法 6.8.8 ”给 定 一 个 通用 去 T 和 函数 依 末 集 F， 这 个 算法 产生 T 的 -个 符合 第 二 范式 旦 保持 
F 中 国 数 依赖 的 无 损 连 接 分 解 。 算法 输出 最 终 数 据 库 模 式 中 表 的 标题 (属性 集合 ) 的 一 个 集合 。 


REPLACE F WITH MINIMAL COVEFR OF F; i* Use algorithm .5.13 *f 
$ = 和; Ax nitialize $ to Puld set *y 
FOR ALL % » YY¥ in F ?+ loop on FUs found 1n 二 i 
IF, FOR ALL 2 Ee S$, 并 i no table cortains EY oo— 二 上 
THEN $5 = 5 ow Headingii wo ¥): A add new table Heading to $ wf 

END FOR fr end loop on FDs i 
IF, FOR ALL CANDIDOATE KEYS k FOR T i if no canrdidate keys Cf T si 
FDOR ALL XX E 5, 长 还 工 i AF Contained in any table wi 

THEN CHODSE A CANGIOATE KEY KE ANO :* choose a candidate Key 二 7 

SET 5 ~ 竺 拼 站 作证 向 人 KR: 7 and add new table to 5 «yy 


注意 到 函数 Heading{K) 牛 成 一 个 集合 ， 包 会 属性 集合 KK， 它 可 以 被 加 入 到 集合 S 中 ，S 是 - 
个 属性 集合 的 集合 。 国 

例 6.8.10 为 说 明 为 什么 在 算法 6.8.8 中 有 了 时候 需 此 选择 候选 键 ， 考虑 下 面 一 个 小 型 的 学 校 
数据 库 。 给 定 -… 个 通用 表 ， 其 标题 如 下 : 

HeadiT} = instructor class no class roeom text 


和 消 数 依 束 集 F 


F = {class_ no — class room text} 

在 E-R 概 念 中 ， 有 一 个 实体 Classes，、 几 clLlass_no 标 识 ， 且 实际 的 班级 在 具有 唯一 内 
容 的 同一 教室 中 举行 它 的 所 有 有 会议。 是 否 有 实体 class_rooms (标识 符 是 class_room ) 
是 可 选择 的 。 因 为 没有 哪 一 个 肾 数 依赖 的 左边 是 class_room， 所 以 这 样 一 个 实体 将 没有 摘 
述 符 属性 、 并 上 生 在 关系 模型 中 没有 与 忆 对 庙 的 表 ;， 因此 如 果 我 们 愿 午 ， 可 以 把 class_room 
认为 是 一 个 描述 符 属 性 .对 Head(T) 中 的 属性 kext 可 以 用 同样 的 方式 讨论 ,但 是 HeadOnm 中 的 
属性 inscrucetor 的 情 闹 不同， 因为 属 忻 insktructor 不 钙 class_no 图 数 诬 是 ， 所 以 …… 个 
班级 可 能 有 几 个 教师 ， 同 时 尖 为 jnstructor 不 晴 数 决定 class_no， 这 意味 着 一 个 教师 可 
以 教 多 个 班级 。 由 此 很 清楚 教师 不 依赖 于 班级 而 存在 . 事实 上 表示 了 一 个 实体 Instructors。 
表 T 实 际 上 包含 了 Instructors 和 Classeg 之 间 的 一 个 联系 。 

根据 标准 BCNF/3NEF 规 范 化 方法 ， 因 为 属性 class_room 利 text 在 表 T 中 依赖 于 
class_no， 所 以 我 们 需要 把 T 分 解 成 为 两 个 表 ，T, 和 T,， 如 下 


HeadiT1) = class_ no class room text 


Headt Ta) = instructor class no 
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但 是 存 算 法 5.8.8 中 ， 因 为 属性 jnstructor 不 存在 于 F 的 任何 立 数 依 整 中 只 有 表 T, 将 在 
浓 数 依赖 的 首次 循环 中 被 创建 。 然 而 从 标准 集合 闭 包 方 法 中 可 以 很 明显 春 到 ，T 的 唯一 候选 
键 是 class_no instructor， 因此 ， 算 法 6.8.8 中 候选 键 上 的 循环 在 为 集合 S$ 创建 表 T, 时 
是 击 要 的 。 | 

通常 我 们 说 规范 化 方法 和 E-R 方 法 互相 补充 ， 例 6.8.10 给 出 了 这 方面 的 例子 ， 不 考虑 图 数 
依赖 就 不 会 清楚 为 行 么 数据 项 instructor 一 定 代 表 一 个 宝 体 而 数据 项 class_room 不 是 ， 
滔 一 方面 ， 为 什么 在 算法 6.8.8 在 候选 键 上 衡 环 对 创建 表 T2 是 需要 的 ?E-R 方 法 解释 了 这 样 做 
的 动机 ， 我 们 需要 用 点 T, 来 表示 实体 Tnstructors 和 Classes 之 问 的 联系 - 

4. 规范 化 的 回顾 

在 数据 库 设 计 的 规范 化 方法 中 ， 我 们 从 一 个 数据 项 集合 以 及 .- 个 函数 依赖 集 F 开 始 ， 设 计 
害 希 望 这 个 函数 依赖 集 在 数据 库 将 来 任何 内 容 中 都 被 数据 库 系 统 维持 ,， 数 据 项 全 放 兽 在 单个 
通用 表 T 中 ， 集 合 F 用 - :个 等 价 最 小 覆盖 苦 换 掉 ; 然后 设计 者 决 定 这 个 表 的 “个 分 解 ， 将 表 分 
解 成 里 小 的 表 构 成 的 一 个 集合 {T,,T,,…",T,}， 它 其 有 的 很 多 优良 性 版 如 下， 

1) 分 解 是 无 损 的 ， 所 以 T=T, mT2 mM… mT,。 

2) 在 可 能 的 最 太 限度 内 , 表 T 中 存在 唯一 遇 数 依赖 X 一 Y 是 由 XX 包含 TT 的 某 个 键 K 而 广 生 的 ， 
这 是 BCNF/3NF 定 义 强 加 的 。 

3) 上 中 所 有 形式 是 X 一 Y 的 函数 依 藉 在 分 解 出 的 表 中 被 保 皖 。 

性 质 2 的 价值 是 我 们 可 以 避免 在 6.5 节 中 定义 的 各 种 异常 。 同 样 重要 的 是 ， 根 据 这 些 范式 ， 
我 们 可 以 保证 函数 依 整 不 会 被 破坏 ， 红 要 我 们 保证 一 个 表 的 所 有 键 的 唯一 性 。 在 第 7 章 的 升 始 ， 
我 们 将 看 到 SQL 的 Create Table 语 句 给 我 们 提供 了 一 条 途径 来 定义 一 个 表 的 这 此 键 K， 而 这 些 
键 的 唯一 性 将 被 系统 保证 ， 对 于 其 后 所 有 SQL 的 表 更 新 语句 都 将 成 立 (一 个 打 骸 这 种 唯一 件 
约束 的 更 新 操作 会 产生 一 个 错误 )。 如 同 我 们 稍 后 将 看 到 的 , 如果 秋 所 涉及 的 键 列 上 建立 索引 ， 
那么 只 一 性 条 件 很 容易 检查 ; 然而 表 T, 的 一 般 函 数 依 赖 X 一 Y 较 为 用 难 ， 其 中 存在 有 相同 X 值 
的 名 行 。 标准 SQL 没 有 提供 一 个 约 吕 来 保证 这 样 的 一 般 函 数 焦 赖 不 广 生 哆 新 销 误 。 

性 质 3 的 意义 同样 明 最 ， 因 为 我 们 想 确 保 设计 者 提供 的 所 有 水 数 依赖 对 数据 库 的 任何 串 能 
内 容 都 成 立 。 性 质 3 意 味 着 在 最 终 的 数据 模式 中 函数 依赖 不 能 跨越 表 ， 所 以 如 果 一 个 表 的 更 新 
发 生 ， 只 有 那 张 表 的 函数 依赖 需要 被 系统 测试 。 另 一 方面 ， 我 们 提供 的 分 解 的 确 导 致 一 定数 
量 的 连接 测试 ， 因 为 标准 无 损 连 接 分 解 为 表 T, 和 种 T, 导 致 其 中 一 个 表 的 键 产 生 ， 而 这 个 键 的 属性 
存在 于 此 个 肯 中 ， 也 就 是 个 由 (Head(T,) 丫 Heagd(T,)) 构 成 的 键 。 标 准 SQL 提 供 了 一 个 约束 ， 
称 为 参照 完整 性 ， 呆 以 在 Create Table 语 名 中 施加 米 确 保 属 性 值 在 它们 连接 的 两 个 表 之 间 依 然 
有 意 六 ， 这 个 约束 也 熙 称 为 外 键 条 件 . 

总 之 ,标准 3NF 分 解 消除 了 大多 数 的 异常 ， 使 得 数据 库 在 更 新 时 有 效 此 验证 所 期 望 的 清 数 
依赖 是 否 恢 然 保 持 成 为 可 能 ， 

还 有 其 他 一 些 范式 ，4NE 和 5NEF， 这 里 不 作 介 绍 。 特 别 上 地， 第 站 范式 ， 即 4NF， 基 十 一 
个 完全 新 型 的 依赖 ， 这 种 依赖 称 为 党 值 依赖 。 你 可 以 从 推荐 读物 [4] 或 者 [5] 得 到 它们 的 详细 
描述 。 

在 此 ， 我 们 旭 - 一 下 过 度 规范 化 【evernormalization )。 当 以 3NF 做 为 目标 时 ， 它 导 敏 -个 
数据 库 分 解 成 比 所 沉 要 的 还 要 多 的 表 ， 过 度 规范 化 被 认为 是 不 良 实践 。 例 如 ， 如 果 我 们 把 表 
depts 分 解 成 两 个 表 ， 一 个 包含 dept_name 和 dept_phone， 革 一 个 包含 dept_name 和 
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dept._mgrname， 我 们 当然 也 得 到 了 … 个 3NF 的 数据 库 ， 但 是 在 分 解 上 我 们 已 经 走 的 比 需 要 
的 延 了 ， 在 检索 所 有 部 门 信息 时 将 出 现 不 必要 的 低 效 现象 ， 因 为 此 时 需要 进行 连接 操作 。 


6.9 其 他 设计 考虑 


BE-R 方 法 各 规范 化 方法 都 有 各 自 缺 点 。 通 常 表现 为 ，E-R 方 法 极端 地 依 顿 直觉 ， 但 是 如 果 
直觉 是 错误 的 ， 郊 乎 没有 任何 反馈 。 如 同 我 们 在 例 6.8.10 中 看 到 ， 单单 依靠 直觉 来 决定 是 否 一 
个 数据 项 代表 了 一 个 实体 很 困难 。 这 使 得 我 们 由 规范 化 形成 了 函数 依赖 的 慨 念 。 规 范 化 更 多 
基 才 数学 方法 ， 而 用 在 应 用 时 更 为 机 械 ， 但 是 想 在 逻辑 数据 库 设 计 的 第 一步 就 写 出 一 个 完整 
的 本 数 依 顿 集 经 党 是 妄想 的 ， 过 后 可 能 就 会 发 现 一 些 函 数 依赖 被 遗 油 了 ， 运 用 直觉 来 发 现实 
体 和 联系 以 及 弱 实 体 等 等 有 助 于 设计 者 发 现 可 能 被 遗漏 的 丽 数 依赖 。 

习 一 个 影响 规范 化 方法 的 轴 素 是 ， 可 能 需 瘟 一 定量 的 判断 来 决定 是 否 特 定 的 琴 数 依赖 应 
当 在 最 终 的 设计 中 反映 出 来 。 考 虑 CAP 数 据 库 模式 ， 它 的 表 在 狗 2-2 中 列 出。 看 起 来 所 有 对 数 
据 库 成 立 的 本 数 依赖 都 是 表 中 键 依赖 的 反映 ， 所 以 所 有 表 都 是 BCNEFE 的 。 然 而 ， 有 个 两 数 依 
赖 未 被 预料 到 ， 它 有 共有 如 下 形式 ; 

t6.9.1] qty price discnt 一 dollars 

对 每 一 个 订单 ， 从 订购 数量 、 产 品 价格 、 顾 客 折 扣 我 们 可 以 计算 出 这 个 订单 的 金额 一 这 
个 联系 在 2,1 节 中 提 到 ， 并 用 SQL 的 Tnsert 语 句 [6.9.2] 表 达 。 现 在 的 问题 是 ， 这 个 函数 依赖 使 得 
图 2-2 中 的 表 集 合 变 成 一 个 不 良 设 计 吗 ?显然 这 个 哨 数 依赖 是 跨越 多 个 表 的 ， 所 以 分 解 不 保持 
依赖 。 注 意 刘 我 们 可 以 创建 男 -- 个 表 dgdol1lars， 和 包 会 函数 依赖 [6.9.1] 上 两 边 的 所 有 属性 gqty 
price discnt dollars,， 同时 从 orders 中 去 除 属 性 dollars。 绪 灯 是 CAP 的 一 个 含 五 个 
表 的 模式 ， 其 中 包括 表 9do1l1ars。 这 是 一 个 可 以 由 算法 6.8.8 得 到 的 3NF 没 计 。 表 ddoilars 
的 唯一 键 是 qty price qiscnt， 唯 一 的 函数 依赖 在 [6.9.1] 中 给 出 。 然 而 这 个 设计 存在 一 个 
问题 。 无 论 何 时 我 们 想 检索 一 个 订单 的 金额 ， 对 于 给 定 的 gty、Pprice 和 aqiscnt， 我 们 不 得 
不 连接 二 个 表 : 从 proeducts 得 到 price，、 从 customers 得 到 qiscnt， 从 daoliars 得 刘 
dollars 值 。 所 有 这 些 是 必须 的 吗 ?” 最 初 图 2-2 中 的 设计 从 这 - -点 来 说 似乎 更 好 。 

如 条 考虑 分 解 的 原始 动机 ， 我 们 可 以 找 出 两 点 : 消除 异常 和 使 所 有 晴 数 依 环 在 任何 时 候 
数据 变化 时 依然 有 效 。 但 是 我 们 真 的 想 使 用 范式 中 一 个 唯一 键 约束 来 使 这 个 函数 依赖 有 效 
吗 ?” 设想 当 一 个 新 的 订单 被 插 人 时 ， 程 序 逻 辑 计 算出 金额 总 基 并 存 喧 ， 就 像 如 下 操作 ; 

[6.9.2] exec 59q1 insert into orders 


values {fordno, :month, :eid, :aTld, :pld, :9ty, 
qty*:price - Ol*:discnt*:aqty*: priee; 


由 这 个 Insert 命 令 我 们 可 以 保证 函数 依赖 [6.9.1]， 并 且 还 保证 了 用 冰 数 依赖 不 能 表示 的 确 
切 数值 联系 。 表 dadaollars 能 够 提供 的 唯一 保证 是 : 如 果 存 在 先前 的 : - 行 有 给 定 的 aty 、 
price 和 discnt， 那么 计算 出 的 dollars 值 将 是 相同 的 。 这 看 起 来 昨 一 个 非常 奇怪 的 有 效 
性 ， 因 为 如 采 有 很 多 产品 和 左 客 ， 订 购 量 差别 很 大 且 在 订购 条 上 日 的 数量 上 有 某 种 限制 ， 那 么 
我 们 希望 在 第 -* 次 加 入 很 多 (gty，price，discnt) 元 组 ， 所 以 这 样 的 唯一 键 约束 没有 县 有 
实际 价值 的 验证 功能 ; 没有 具有 相同 键 的 旧 行 可 以 与 之 比较 。 你 将 宁愿 依赖 于 Insert 语 句 
16.9.2] 米 进行 正确 的 计算 。 基 于 此 ， 在 一 个 检验 过 的 函数 中 提供 这 个 插入 当然 是 有 意义 的 ， 
这 个 图 数 在 所 有 的 逻辑 搬 人 新 行 的 操作 中 必须 使 用 。 
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静 在 删除 种 插 人 于 常 共同 说 明 我 们 不 想 琶 失 有 关 尾 何 (sty,price,aiscnt) 匹 组 的 信 
已 ， 但 是 如 果 考 虑 到 我 们 并 不 真正 评价 这 个 有 效 性 方法 ， 这 便 是 一 个 有 问题 的 俞 题 。 至 于 更 
新 异常 ， 对 于 给 定 的 (qty，price，qdiscnt) 我 们 考虑 需要 立即 更 新 所 有 金额 值 的 情况 。 如 
果 和 需要 为 先前 输入 的 订单 改变 price 或 者 discnt 值 ， 需 要 更 正 ， 这 便 可 能 发 生 。 但 是 这 个 改 
变 如 此 不 寻常 并 对 一 个 批发 业务 将 产生 重大 影响 ,假设 一 个 不 熟练 的 程序 员 能 够 写 出 代码 来 
更 正 orders 中 稍 误 输入 的 一 行 是 不 合 情 理 的 。 事 实 上 ， 很 密 设 计 者 会 把 dqol1ars 列 设计 成 
只 能 做 插 人 操作 的 有 量 ， 和 根本 不 能 被 更 新 ( 期 望 改正 输入 错误 }， 所 以 我 们 愿意 放弃 对 更 新 异常 
的 防范 。 

我 们 在 这 里 己 经 用 例子 详细 说 明了 一 种 在 商业 应 用 中 频繁 发 生 的 情况， 邯 一 种 通过 反 向 
规范 化 来 提高 性 能 的 方式 。 大 名 数 设计 实践 者 会 承认 经 常 需要 做 这 种 囊 情 . 

数据 库 设 计 工 具 

很 多 商业 产品 以 提供 支持 数据 库 管 理 员 进行 数据 库 设计 的 环境 为 日 标 。 这 些 环境 作为 数 
据 库 设计 工具 提供 ， 有 时 候 则 作为 计算 机 辅助 软件 工程 {CASE) 工具 的 .部 分 ，CASE 是 一 
种 更 一 般 低 的 产品 。 这 种 工具 通 贡 有 很 多 组 件 ， 它 们 由 下 面 各 种 类 型 组 件 中 的 部 分 组 成 、 单 
个 产品 提供 所 有 这 些 组 件 是 很 少见 的 。 

E-R 设 计 编 辑 器 ”一 个 遂 用 组 件 是 设计 者 可 以 在 其 中 构造 E-R 疼 的 界面 ， 可 以 通过 图 形 
的 拖 放 方式 来 编辑 和 修改 E-R 图 ， 拖 放 方 式 在 Apple 的 Macintosh 和 Microsoft 的 Windows 中 很 
容易 实现 。 

E- 只 到 关系 设计 转换 器 ”这 类 工具 的 巡 一 个 通用 组 件 是 可 以 自动 将 已 -R 设 计 转 找到 头 系 表 
定义 集合 的 转换 器 。 它 按照 6.3 节 中 概述 的 步骤 进行 ， 在 6.4 节 中 举 了 例子 。 

有 了 数据 库 设 计 工 具 ， 开 发 流程 通常 从 E-R 设 计 开 始 ， 直 到 关系 表 定 义 结束 。 然 而 ， 很 多 
产品 姓 理 消 数 依赖 。 有 一 个 工具 用 来 装载 一 个 小 型 通用 表 ， 并 从 这 些 数 据 中 提取 可 能 成 立 的 
郑 数 依赖 ， 然 后 自动 生成 这 个 函数 依 巾 集 合 到 BCNF/3NE 的 等 换 。 

函数 依赖 到 E-R 讽 计 转 换 器 ”有 时 候 也 提供 男 一 种 类 型 的 组 件 ， 它 从 - -个 数据 库 的 是 数 依 
赖 集合 生成 有 效 的 E-R 图 来 反映 数据 的 规则 . 

如 同 在 前 一 节 中 说 明 的 ，: 一 个 理论 上 完美 的 设计 可 能 效率 十 分 低下 。 所 以 好 的 说 计 工 其 
试图 分 析 一 个 设计 的 性 能 表现 ， 并 接受 设计 者 的 决定 来 进行 特定 种 类 的 反 向 规范 化 以 提 商 性 
能 。 另 外 ， 工 具 必 须 “ 原 谅 ” 画 数 依赖 和 实体 分 类 的 错误 和 缺漏 ， 以 产 牛 设计 的 其 种 最 佳 推 
测 ， 设 计 者 在 做 更 正 时 可 以 措 绽 出 这 个 设计 。 由 此 引 思 了 刀 一 种 类 型 的 慰 准 工具 绢 件 。 

设计 分 析 器 ”这 些 组 件 分 析 目 前 阶段 的 设计 并 给 出 报告 ， 它 可 以 帮助 数据 库 管 理 员 改正 各 
种 各 样 的 错误 。 

蔡 想 更 好 地 了 解数 据 库 设计 工具 ， 你 可 以 阅读 “推荐 读物 ”中 的 推荐 读物 [11 的 最 后 一 章 。 


推荐 读物 


在 逻辑 数据 库 设计 领域 中 ， 术 语 存 在 很 多 差异 是 普遍 的 。E-R 方 法 有 时 候 被 称 为 语义 建 模 
(semantic modeling }。 我 们 把 现实 世界 的 对 得 称 为 实体 实例 ， 而 其 他 的 文字 中 常常 称 为 实 
体 ; 我 们 称 实体 是 一 个 实 位 实例 的 类 ， 而 他 们 称 为 实体 类 型 ， 下 如 我 们 在 第 4 章 中 的 对 象 和 对 
象 类 型 。 属性 有 了 时候 也 被 称 为 性 质 ( property )。 

让 我 们 试 着 解释 语义 建 模 意 昧 着 什么 。 在 一 种 程序 设计 语言 中 ， 请 言 的 语法 说 明了 语句 
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如 何 由 基本 的 文字 元 素 构成 ， 然 而 语法 不 关联 任何 语句 的 含义 。 一 个 对 程序 设计 语言 语句 在 
所 有 条 件 下 如 何 作用 的 说 明 ， 即 这 些 语句 起 什么 作用 ， 被 称 为 语言 的 语义 〔 semantics )。 术语 
“语义 建 模 ” 旱 示 着 在 E-R 方 法 中 我 们 将 涉及 数据 项 实际 上 表示 了 秆 么 ， 以 使 能 够 按照 数据 库 
结构 (如 关系 表 ) 的 概念 来 模型 化 它们 的 行为 。 
推荐 污 物 [1}、[2] 和 [种 中 介绍 了 逻辑 数据 库 设计 。 鹤 荐 读物 [1] 的 最 后 章 市 中 还 有 David 
Reiner 写 的 一 篇 关于 数据 库 设 计 的 商业 产品 即 数 据 库 设 计 工 具 的 文章 。 推 荐 读物 [3] 和 上] 对 本 
章 中 没有 介绍 的 很 多 规范 化 概念 有 很 好 的 描述 。 推 荐 读物 [3] 尤 其 先进 ， 代 表 了 这 一 领域 的 最 
新 成 乐 。 排 荐 读物 [6] 与 本 章 处 于 同一 个 层次 ， 介 绍 了 实体 联系 和 规范 化 。 
[1] C. Batini, $. Ceri, and S. B. Navathe. Conceptuat Databare Design. Redwood City, CA: 
Benjamin-Cummings, 1992. 
[2] C.J. Date. An Introaduction to Database Sysrems. th ed. Reading, MA: Addison-Wesley, 1995. 
[3] David Maier. The Theory of Relational Database. New York: Computer Science Press, 
1983. 
[4] Toby Ff. Teorey. Database Modeling and Desipn: The Fundamenial Principles. 2nd ed. 
San Francisco: Morgan Kaufmann, 1994. 
[5] Jeffrey D. Ullman. Damabase and Knowledge-Base Systems. Yolum 1. Rockville, MD: 
ComMmputer Science Press, 1988. 
[6] Jeffrey D. Ullman and Jennifer Widom. A First Course i Dartabase Systems. Englewood 
Clifs, NJ: Prentice Hall, 1997., 


习题 


在 本 书 最 后 的 “习题 解答 ”中 给 出 答案 的 习题 用 "号 标 出 。 

6.1。 在 图 6-6 中 ， 如 昌 我 们 不 假设 三 个 图 中 R 的 连接 线 的 数 日 完全 表示 了 设计 者 的 意图 ， 
而 假设 这 个 数 日 是 偶然 的 但 在 设计 者 意图 的 限制 之 内 。 在 一 些 情 况 下 我 们 仍然 可 以 得 出 与 R 关 
详 和 的 E 和 F 的 min-cardO 和 max-card 值 。 列 出 图 56-6 中 三 个 图 的 这 些 值 . 

6.2。 如 同 在 例 6.1.3 中 指出 的 ， 表 oraers 不 表示 一 个 联系 ， 而 更 像 一 个 实体 oraders。 实 
体 Orders 自 身 被 一 个 二 元 联系 连接 到 三 个 实体 Customers，Agents 和 Products。 这 些 
联系 如 下 : Customers 要 求 (requests ) Orders，,，Agents 设 置 (places ) 0rders 和 和 
orders 装 运 (ships ) Products。 男 出 所 有 这 些 实体 和 联系 的 E-R 图 并 附加 所 有 相关 的 属性 ， 
标明 主键 和 基数 。 注 意图 5- 11 非常 不 同 ， 一 个 实体 Orders 册 多 个 Line_items 构 成 。 

6.3 ”模仿 6.4 节 的 例子 ， 创 建 E-R 设 计 并 由 此 生成 数据 库 的 关系 表 设 计 米 表示 一 项 雏 行 业 
务 。 在 数据 库 中 ， 我 们 需要 知晓 在 这 家 银行 的 分 行 中 有 账户 的 顾客 。 每 一 个 账号 在 一 -个 特定 
分 行 中 保存 ， 但 是 一 个 顾客 可 能 有 多 个 账户 并 且 一 个 账户 可 能 有 多 个 相关 联 的 顾客 。 我 们 用 
acctia 滩 及 附加 的 属性 acc_type (存款 ,结算 等 等 ) 和 acct_bal (账户 余额 ) 来 标识 三 
户 。 每 一 个 分 行 有 一 个 标识 答 bne 和 一 个 属性 bcity。 顾客 用 ssn ( 社会 保险 号 ) 来 标识 并 有 
属性 cname，cname 由 clname、cfname 和 cmidinit 构 成 。 

在 这 个 皇 -R 设 计 中 ， 你 庶 当 考虑 如 何 表示 顾客 -账户 -分 行 的 组 人 台 。 世 许 所 有 这 三 个 全 是 实 
体 ， 并 且 它 们 之 间 有 一 个 三 元 联系 ， 或 者 只 有 两 个 实体 Customers 和 Branches， 
has_aceount 是 它们 之 癌 的 一 个 联系 ， 该 联系 具有 自己 的 属 人 性， 联系 的 实例 表示 一 个 账户 。 
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可 能 有 不 止 一 个 正确 的 解决 方案 ， 但 是 在 这 些 可 选 方案 中 你 至 少 应 当 能 够 做 出 一 个 。 你 可 以 
状 宏 这 三 个 设计 ， 决 定 哪 一 个 你 更 欣赏 ， 并 全 少 证 明 它 们 中 一 个 的 正确 性 。 在 证 明 你 的 决定 
时 ， 淮 虑 下面 的 问题 : 是 不 是 所 有 这 些 设计 都 允许 几 个 顾客 共同 拥有 同一 个 账户 ? 

6.4 ”在 例 6.6.4 中 ,假设 由 内 容 推导 出 的 了 靖 数 依赖 是 正确 的 ， 但 是 现在 新 的 行 可 以 被 加 入 
( 必须 仍然 理 守 这 些 函 数 依 赖 ) 下 面 哪些 行 可 以 合法 地 加 入 到 已 经 存在 的 行 中 去 ?如 果 不 能 
加 入 ， 说 明 例 子 中 使 加 入 操作 不 合法 的 函数 依赖 编号 。 


Gy [sw oe 
(b) 4 
(ey 
EEC 
6.5 “* 像 例 6.6.4 那 杆 ， 列 出 下 面 表 T 满 足 的 所 有 郑 数 依 顿 ， 这 里 我 们 假设 设计 者 的 意 网 是 
只 有 这 些 行 的 集合 可 以 存在 于 表 中 。 


Ts eT 
meer 
EE 
Erer 
ET 


6.6 以 如 于 表 T 重 复 前 一 个 练习 。 


Ta To 
aa 
EECIESE3 
Brac 
ml 
lw [le 


6.7 [ 难 ] 我 们 扩展 例 6.6.4 中 的 想 落 ， 表 中 有 国定 的 内 容 ， 设 计 痢 的 意图 是 只 有 那些 行 可 
以 存在 于 表 中 ， 所 以 函数 依赖 可 以 通过 测试 来 决定。 注意 到 如 果 给 定 一 个 硼 ， 它 具有 给 定 的 
标题 《属性 集 台 )， 但 是 包 会 或 者 零 行 或 者 一 行 ， 测 试看 起 来 允许 折 有 可 能 的 申 数 依赖 成 立 。 
为 了 由 定义 6.6.2 说 明 一 个 未 数 依赖 不 满足 ， 在 表 中 必须 至 少 有 两 行使 得 在 杀 些 列 上 匹配 但 在 
其 他 列 上 不 匹配 。 一 个 阿 姆 斯 特 庆 表 (Armstrong table ) T 是 包含 最 少 行 的 表 ， 从 它 的 内 容 可 
以 使 一 个 给 定 的 函数 依赖 集 F 成 立 ( 当然 也 使 所 有 F'* 中 的 国 数 依赖 成 立 )， 而 所 有 不 在 F' 中 的 
溺 数 依赖 将 不 成 立 。 所 以 如 果 久 一 A 不 是 在 中 的 函数 依赖 ，T 中 一 定 有 两 行 满足 a[ 关 ]=v[XI] 且 
u[A]<>v[A]: 
(aj。 在 例 6.6.4 中 的 表 是 阿姆斯特朗 表 吗 ? 请 说 明 。 你 能 给 出 一 个 表 ， 它 具有 更 少 的 
行伍 决定 了 相同 的 画 数 依赖 集 吗 ? ( 可 能 没有 。) 
(b) 习题 6.6 中 给 出 的 表 是 一 个 阿姆斯特朗 表 吗 ? 按照 (a) 来 说 明 你 的 问答 。 
(c) 创建 :个 阿 姆 斯 特 良 表 来 表示 下 面 在 属性 A，B，C，D( 没 有 其 他 属性 ) 上 的 晴 数 
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依赖 集 。 如 果 还 存在 共 他 了 葡 数 依赖 ， 则 回答 和 失败。 试 创建 一 个 具有 最 少 行 集合 
的 表 ， 它 具有 这 一 性 质 。 
(1) A B 一 D, (2) B C—A 

(d) [很 难 ] 给 出 一 个 算法 ， 它 可 以 由 一 个 给 定 的 属性 集 .E 的 函数 依赖 集 生 成 一 个 阿 姆 
斯 特 朗 表 。 这 个 算法 说 明 阿 姆 斯 特 雇 表 总 是 存在 的 。 

6.8 给 出 定 六 6.6.6 人 阿姆斯特朗 公理 的 传递 规则 的 证 明 ， 按 照 定 理 6.6.3 中 包含 规则 以 及 定 
理 6.6.7 的 增 广 规 则 的 证 明 形 式 。 

6.9。 使 用 定义 6.6.6 中 阿姆斯特朗 公理 来 推导 和 定理 6.6.8 中 列 出 的 没有 给 出 证 明 的 规则 。 

6.10 考虑 下 面 一 组 岗 数 依赖 推导 规则 ， 其 中 ， 义 ，Y，Z 和 W 是 属性 集合 ，B 是 单 - -属性 . 

1) 自 反 规则 { Reflexivily rule ) : X 一 X 水 真 。 
2) 投影 规则 (Projectivity rule ) : 如 果 XX 一 YZ, 那么 X 一 YY。 
3) 累积 规则 (Accumulation mle ) : 如 时 X 一 YZ 且 Z 一 B W, 那么 XX 一 YZB。 

说 明 如 何 用 这 些 规则 推导 定义 6.6.6 中 的 三 个 推导 规则 ， 即 阿姆斯特朗 公理 ， 以 及 这 些 规 
则 如 人 箱 从 何 姆 斯 特 朗 公 理 推导 。 因 为 所 有 规则 可 以 从 阿姆斯特朗 公理 推导 因为 完 着 性 )， 所 
以 这 三 个 规则 炸 成 了 一 个 蔡 代 的 规则 完备 集 。 

6.11 ”[ 难 | 给 定 属性 集 S 和 函数 依赖 集 F ， 我 们 说 包含 在 S 中 的 属性 集 X 在 F 下 具有 非 六 几 集 
合 闭 包 ， 只 要 XX! - X 是 非 空 的 。 主 FE 是 依赖 的 最 小 集 ， 就 是 说 ，EF 的 最 小 覆盖 是 F。 通 过 构造 所 
有 F 中 罗 数 依赖 左边 的 属性 集 侣 X, 的 集合 闭 包 ， 我 们 可 以 创建 一 个 非 平 凡 苑 数 依 赖 基础 EB， 然 
后 创建 B 中 的 饼 数 依赖 FD,: X 一 (X- - 买 )。 

(ay* 说 明 如 果 X 是 不 包含 F 中 的 某 个 函数 依赖 左边 筷 的 属性 的 集合 ， 那 么 在 FE 中 函数 
依赖 的 团 包 下 XX'=X。 

(b) 下 面 是 一 个 看 起 来 很 有 道理 的 假设 所 有 在 扩 中 的 号 数 依 丹 W 一 Z (这 里 W 和 ZZ 
没有 共同 属性 ) 直接 由 非 平凡 函数 依赖 基础 B 产 生 ， 以 致 于 如 果 属 性 AeZ， 那 
和 公 太 e {X -其 } 对 B 中 其 个 具有 形式 和 一 (人 - 区) 的 FD 成 半 ,， 其 中 XX 所 WW. 然而 ， 
这 个 单纯 的 设想 是 错误 的 。 构 造 属性 集 S 和 函数 依赖 集 F 形 成 一 -个 反例。 在 F 中 
只 需要 两 个 函数 依赖 。 

6.12 使 用 阿姆斯特朗 公理 和 定理 6.6.8 的 结果 以 及 下 面 来 自 例 6.6.4 的 函数 依赖 集 : 

{ll} AB, (2} C—=B, (3} DA BOC, (4) A CED 

推导 下 面 标号 为 (a) 到 (c) 的 函数 依赖 。 使 用 一 步 接 一 步 的 方式 来 推导 ， 每 一 步 者 用 上 面 公 

理 中 的 规则 标记 。 
(DABCD 
(DAC—BD 
(ec) AC 一 ABCD 
6.13 在 例 6.6.6 中 ， 函 数 依赖 集 F 覆 盖 集 合 G。 试 说 明 相 反 的 情况 即 集合 G 覆 盖 集合 F。 
6.14 (ay* 证 明 例 6.6.9 中 的 语句 : 例 6.6.4 中 推导 的 函数 依赖 不 是 最 小 的 。 这 可 以 通过 寻找 
一 个 最 小 覆盖 的 步骤 完成 。 
(bj 在 (a) 中 ， 只 有 一 个 从 例 6.6.4 推 导 的 角 数 依赖 需要 改变 以 生成 一 个 最 小 闭 莫 。 使 
用 推导 函数 革 涵 的 一 个 简单 应 用 来 解释 这 个 更 改 的 必要 性 。 

6.15* ”在 算法 6.6.13 中 第 二 步 ， 说 明了 用 来 决定 Y+ 在 从 疝 数 依赖 集合 H 变 到 集合 J 时 不 变 

的 测试 同样 暗示 着 H 和 了 了 相同， 如同 在 算法 中 定义 的 。 
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6.16 (3a) 复习 例 6.6.8 并 考虑 在 陋 数 依赖 集中 做 的 每 一 个 更 改 . 然后 试 着 使 用 阿姆斯特朗 
公理 来 说 明 每 一 个 改 安 将 生成 相 问 的 函数 依赖 闭 包 。 

(b) 在 例 6.6.8， 我 们 去 除 B 之 后 的 第 三 步 中 ， 证 明 如 果 我 们 再 次 考虑 去 除 A， 那 么 仍 
然 是 不 恰当 的 。 

(c) 你 能 够 找到 论据 来 说 明 为 什么 在 第 三 步 中 考虑 过 该 问题 一 次 并 除去 了 -一 个 不 同 
属性 后 再 次 考 虚 去除 一 个 左边 的 属性 是 不 必要 的 吗 ? 

6.17 证 明 例 6.6.10 的 陈述 ， 即 例 6.6.3 给 定 的 数据 库 emp_info 的 函数 依赖 【集合 F ) 构成 

了 一 个 最 小 集 。 通 过 寻找 最 小 覆盖 的 步 双 证 明 。( 使 用 在 例 6.6.7 中 介绍 的 推导 表示 。) 

6.18 (a) 假 设 给 定 了 三 个 表 T、T1 和 T2， 旦 T=T1 mmT2，Head(T1) 门 HeadfT2) 一 Head(T2)， 
那么 如 果 T 补 分 解 到 (投影 到 ) S1 和 3$2， 其 中 HeadrSi)=HeadrT1I) 且 
Head(S2)=Head(T2)， 这 确保 S1 的 行 集 人 台 是 T1 的 行 集合 的 一 个 子 集 ， 类 似 地 ，S2 
的 行 集 合 是 T2 中 行 集合 的 子 集 。 给 出 一 个 例子 说 明 为 什么 我 们 不 能 推导 出 S1=TI1 
和 和 S$2=T2， 

(b) 在 (a) 中 将 连接 替换 成 外 连接 ， 找 一 个 方法 来 扩展 定义 6.7.1 使 之 处 理 无 损 外 连接 
分 解 { Lossless Outer-Join Decomposition )， 并 说 明 在 (a) 末 尾 的 S1=T1 和 S$2=T2。 

6.19 (a) 考 碟 下 面 给 出 的 表 T。 前 先 说 明 这 个 内 容 分 解 成 为 两 个 表 ， 满 足 Head(T1)=A B 和 和 
Head(T2)=B C。 当 重新 连接 时 ， 得 到 初始 表 。 然 而 ， 可 以 通过 从 T 中 去 除 任何 一 
行 然后 看 分 解 结果 来 说 明 这 个 分 解 是 无 损 的 。 





(bj* 如 果 T 上 没有 了 旺 数 依赖 并 且 仍 然 如 此 分 解 的 话 ，T 的 内 容 是 如 何 说 明定 理 6.7.4 的 
“ 仅 当 ”部 分 的 ”请 加 以 说 明 。 

{c) 证 明定 理 6.7.4 没 有 证 明 的 “ 仅 当 ”部 分 ， 即 姐 果 Head(T1) 和 Head(T2) 都 是 
Head(T) 的 真子 集 ，Head(T)=Head(T1)U Head(T2) 有 目 Head(T1) Head(T2) 不 了 晴 数 
决定 Head(T1) 或 者 Head{T2)， 那 么 将 T 分 解 成 Tl 或 T2 将 不 是 无 损 的 。 

6.20 假设 我 们 希望 愉 一 个 数据 项 集合 {A, B,C,D,E,FG } (它们 将 成 为 表 中 的 属性 构 
造 一 个 数据 库 ， 且 给 定 函 数 依 赖 集 F 如 下 : 
F=(l}BCD oo A2BC oA Do EFS GC D6)A GO, 

(a) 找 出 这 个 隆 数 依赖 集 的 最 小 窗 盖 ， 并 命名 这 个 集合 为 G6。( 使 用 例 6.6.7 中 介绍 的 

推导 表 小 。) 

(b)* 由 包含 所 有 这 些 属 性 的 表 T 开 始 ， 进 行 一 个 无 损 分 解 ， 分 解 成 两 个 表 T, 和 T,， 它 们 攀 
成 一 个 2NF 分 解 。 和 仔细 列 出 每 个 表 【〔T，T 和 T ) 的 键 以 及 每 个 表 中 存在 的 隐 数 依赖 。 

(c) 继续 分 解 成 为 3NF 数 据 库 。 这 个 分 解 是 BCNE 的 吗 ? 

(dj* 使 用 算法 6.8.8 和 上 困 数 依赖 集 G 获 得 一 个 你 持 G 中 国 数 依 赖 的 无 损 3NF 分 解 。 这 个 

分 解 与 (e) 中 的 分 解 相同 吗 ? 
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6.21 假设 我 们 希望 由 一 个 数据 项 集合 { A, B, C, D, E, F, G.H } (它们 将 成 为 表 中 的 属性 ) 
构造 一 个 数据 库 ， 且 给 定 函 数 依赖 集 F 如 下 : 


(IASBC,(DIABE 2 CDGH, NC 2 GD,(MD 一 GE 一 E 


(a) 找 出 这 个 函数 依赖 集 的 最 小 覆盖 ， 命 名 为 G。! 使 用 例 6.6.7 中 介绍 的 推导 表示 。) 
(b) 由 包含 所 有 这 些 属性 的 表 T 开 始 进行 一 个 到 2NF 但 不 是 3NF 模 式 的 无 损 分 解 。 仔 
细 列 出 每 一 个 表 (T，T, 和 T, ) 的 键 ， 以 及 每 一 个 表 中 存在 的 图 数 依 顿 。 验 证 这 
个 分 解 是 无 损 的 。 说明 为 什么 是 2NF 但 不 是 3NF 的 。 
(c) 继续 分 解 到 3NF 数 据 库 。 这 个 分 解 是 BCNF 的 吗 ? 
Cd) 使 用 算法 6.8.8 和 (a) 中 的 晴 数 依赖 集 GG 构 造 一 个 保持 G 中 畏 数 依赖 的 无 提 3NF 分 
解 。 这 个 分 解 和 (c) 中 的 分 解 相 同 吗 ? 
6.22。 重复 习题 6.3 中 的 银行 数据 库 关 系 设计 ， 得 这 次 使 用 规范 化 方法 。 这 需要 你 给 出 国 
数 依 束 集 的 直子 集 ， 且 应 当 确 保 你 的 回答 有 意义 。 比 较 所 得 的 结果 和 E-R 方 式 的 结果 。 
6.23 ”假设 我 们 希望 由 一 个 数据 项 集合 { A, B,C, D, E, FG, H, 了 了} (它们 将 成 为 表 中 的 局 
性 }， 和 给 定 了 函数 依赖 集 F 构 造 一 个 数据 库 F 构 成 一 个 最 小 科 盖 . 


(DAB CD,A E(B = FH CC 20 {HD 一 BG o C,H= 1. 


(a) 创建 表 T 的 一 个 保持 函数 依赖 的 3NE 无 损 连 接 分 解 . 使 用 在 文中 提供 的 算法 来 决 
定 分 解 出 的 表 的 标题 ， 并 在 每 个 表 的 一 个 键 加 上 下 划 线 。 

(b) 习题 (a) 中 的 一 个 或 多 个 表 有 两 个 候选 键 ， 找 出 它们 并 证 明 它 们 是 键 。 

(¢) 证 明 这 个 分 解 是 无 损 的 。 

(d) 你 所 创建 的 分 解 是 BCNF 分 解 则 ?说 明 是 或 者 不 是 的 原因 。 

6.24 “再 次 考虑 6.4 节 中 的 飞机 订 票 数据 库 。 注 意 到 旅客 在 登 机 时 会 集中 在 登 机 口 ， 在 起 
来 我 们 可 以 用 联系 Easgengers、Gates 和 Fl1ights 的 一 个 三 元 联系 daeparts 来 符 换 图 6-14 
中 的 两 个 二 元 联系 marshals 和 travels_one 

我 们 注意 到 这 个 联系 是 1-N-N 的 ， 因 为 一 个 登 机 门 有 多 个 航班 和 很 多 旅 寡 ， 它 的 实体 在 联 
系 里 有 max-card=1。 如 同 在 6.2 节 末尾 提 到 的 ， 这 意味 着 我 们 可 以 在 一 个 实体 表 中 使 用 外 键 来 
表示 这 个 联系 。 特 别 地 ， 因 为 实体 Passengers 以 max-card=1 参 与 ， 所 以 我 们 为 登 机 口 和 般 
班 附加 外 键 来 标识 对 一 个 顾客 而 言 唯一 的 登 机 口 和 航班 。 

(a) 把 这 个 具有 三 元 联系 departs 的 E-R 设 计 转 化 成 关系 表 。 

kb) 这 个 关系 设计 与 5.4 节 末尾 的 设计 有 什么 不 同 ? 说 出 哪 一 个 更 好 并 证 明 你 的 回答 . 
{ 称 可 以 试图 提出 和 练习 6.3 末 尾 类 似 的 问题 .) 

(cy 创建 飞机 订 票 数据 库 的 函数 依赖 集 ， 然 后 按照 算法 6.8.8 进 行规 范 化 ， 达 到 一 个 
美 系 表 设计 。 这 对 (b) 中 的 问题 有 什么 启发 吗 ? 


teketno, 
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(d) 如 果 你 创建 了 正确 的 函数 依赖 ， 你 应 当 发 现 对 寺 - 登 机 串 没 有 独立 的 表 。 把 
Sateno 作 为 另 一 个 表 的 属性 所 带 来 的 问题 是 删除 异常 : 如 果 最 后 一 次 航班 从 某 
个 登 机 口 起 及， 那么 将 没有 那个 登 机 口 的 任何 记录 保留 下 来 。 但 是 似乎 规范 化 
过 程 所 说 的 是 似乎 没有 任何 理由 来 记 住 这 个 登 机 口 存 在 。 我 们 可 以 想象 ， 加 入 
一 个 新 的 属性 gatecap 到 设计 中 ， 它 表示 提供 给 在 一 个 登 机 口 等 候 的 顾客 座位 
容量 。 现 在 ， 规 范 化 设计 将 试图 为 登 机 口 男 外 创建 -个 分 离 的 表 。 解 释 为 什么 

(e) 注意 (四 中 对 登 机 口 各 容量 的 设计 ,我们 可 以 很 容易 用 程序 逻辑 来 为 一 次 航班 分 
配 一 个 登 机 口 ， 这 个 登记 口 在 走 飞 前 的 那个 小 时 内 还 没有 被 分 配给 航班 ， 并 且 
有 座位 来 容纳 旅客 。 但 假设 所 有 登 机 口 有 相同 的 座位 容量 ， 我 们 仍然 想 为 航班 
分 配 登 机 日 ， 现 在 (d 刷 由 提 到 的 删除 异 常 成 为 实际 的 问题 . 这 对 规范 化 方法 意味 
者 御 么 ? 
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第 6 章 中 ， 我们 已 经 学 习 了 如 何 通过 设计 一 系列 关系 表 和 荐 数 依赖 为 一 个 公司 建立 数据 模 
型 。 本 章 介 绍 DBA 将 设计 转换 成 物理 形式 所 采用 的 步 又 的 细节 。 第 4 章 中 我 们 已 经 证 尽 介 绍 
了 对 象 -关系 表 ， 所 以 本 章 的 重点 是 关系 表 。 如 果 想 了解 有 关 对 象 关 系 模型 的 更 详细 内 容 ， 特 
别 是 从 Create Table 到 Create Object Table 的 扩展 ， 可 参 疝 附录 C， 那 里 给 出 了 SQL 十 可 的 一 般 
语法 。 

本 章 第 一 节 着 重 介绍 如 和 何 创建 物理 (关系 ) 表 ， 以 及 如 何 给 列 加 上 完整 性 约束 以 保证 其 
和 现实 模型 相 一 致 。 完 整 性 约 东 可 以 保证 第 6 章 中 的 逻辑 设计 阶段 定义 的 数据 相关 忻 不 被 错误 
的 SQL 更 新 语句 破坏 ， 也 就 是 说 ， 我 们 希望 在 出 现 更 新 铺 误 时 保持 数据 的 完整 性 。 本 竟 的 后 
面 几 节 将 详细 介绍 PEA 需 要 对 大 型 的 、 访 问 频 繁 的 数据 库 做 的 几 项 工作 ， 以 使 终 疝 用 户 能 够 
简单 有 效 地 获得 所 需 的 信息 。 首 先 ，DBA 和 需要 定义 表 、 约 束 ， 并 装 入 数据 。 另 外 ， 本 章 还 会 
提 到 一 种 提 殿 数据 视图 的 服务 ,将 物理 表格 重新 组 织 成 不 同 的 表 形 式 【 这 些 表 格物 理 上 并 不 
存在 )， 以 简化 对 数据 的 访问 。DBA 还 需 提 供 安 全 性 ， 保 证 只 有 授权 用 户 才 能 读 取 或 更 新 某 些 
保密 的 数据 。 视 图 的 结构 和 数据 库 的 其 他 对 象 是 通过 一 系列 系统 定义 的 表 提 供给 DBA 的 。 这 
些 表 叫做 系统 目录 ， 在 本 章 的 最 后 介绍 。DBA 同 时 还 应 该 负责 数据 库 的 性 能 ， 如 提供 索引 来 
加 速 对 表 的 访问 及 其 他 类 型 的 调谐 工作 ， 这 些 将 在 第 10 章 讨论 。 

对 一 个 企业 来 说 ， 数 据 库 是 至 关 重 要 的 ， 因 此 DBA 的 责任 非常 重大 ， 他 必须 了 解 所 有 用 
户 的 需求 ， 包 括 终端 用 户 和 应 用 程序 员 。 本 文 的 目的 是 给 出 DBA 所 需 的 一 些 基 本 概念 。 本 章 
介绍 了 DBA 进 行 工作 时 所 需 的 命令 和 特征 。 通 篇 我 们 集中 存 从 操作 性 的 观点 来 看 待 数据 库 概 
念 ， 这 意味 着 重点 放 在 使 DBA 能 够 做 出 明智 、 正 确 的 决定 ， 而 不 是 放 在 系统 程序 员 设 计 实 现 
数据 库 系统 软 件 产品 的 内 部 细节 上 上。 操作 性 的 方法 并 不 代表 我 们 定义 的 概念 不 够 严格 ,只 是 
说 我 们 的 重点 放 在 效果 上 ， 人 例如， 我 们 介绍 的 是 B 树 的 结构 ， 而 不 是 编制 B 树 程 夺 的 细节 。 洋 
事 求 是 地 说 ， 操 作 性 应 该 比 系统 的 其 他 问题 优先 考虑 。 一 个 编写 数据 库 程 序 的 程序 员 如 果 对 
这 种 考虑 对 于 DBA 的 重要 性 没有 正确 的 认识 ,将 会 遇 到 严重 的 障 伺 。 

我 们 曾经 了 解 了 DBA 创 建 表 、 装 人 数据 时 用 的 一 些 命令 。 在 第 3 章 中 ， 我 们 介绍 过 SQL 胡 条 


create table customers Ccid chartda) net null, cname varcharti3y), 
tity varchart?0), discnt real, primary keytcid}): 


我 们 将 会 看 到 ， 这 条 语句 只 给 出 了 整个 语法 的 一 小 部 分 。 
7.1 完整 性 约束 


完整 性 约束 是 表 的 创建 者 出 于 第 6 章 中 提 到 的 各 种 考虑 设计 的 -一 个 规则 ， 所 有 的 SQL 更 新 
语句 都 必须 满足 这 个 规则 。 举 例 来 说 ， 如 果 我 们 规定 数据 库 CAP 中 表 customers 的 cid 列 的 
值 不 能 重复 { 作为 候选 键 或 主键 )， 那么 若 有 一 行 的 cid 列 的 值 与 已 有 的 cid 列 的 值 重复 ， 该 
行 就 不 能 持 人 表 customers 中 。 这 即 是 所 谓 的 现实 世界 的 忠实 的 反观。 实际 上 ， 根 据 我 们 将 
要 介绍 的 完整 性 约束 ， 所 有 违背 完整 性 约束 的 更 新 操作 一 一 Insert ，Update 或 Delete 一 一 都 是 不 


一 
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能 执行 的 。 我 们 在 第 6 童 中 看 到 ， 一些 完 整 性 约束 是 在 设计 阶段 产生 的 ， 例 如 ， 某 些 作为 表 的 
键 的 一 部 分 的 列 不 能 为 空 值 ， 而 且 键 必须 是 唯一 什 。 在 讨论 完整 性 约束 的 优 缺点 之 前 ， 我 们 
先 看 看 它们 在 商用 数据 库 系统 中 是 怎样 实现 的 。 我 们 先 从 SQL 和 标准 开始 ， 从 中 我 们 可 以 看 出 
完整 性 约束 在 Create Table 计 名 中 是 怎样 实现 的 。 

1. Create Tabte 语 问 中 的 完整 性 约束 

最 基本 的 Create Table 语 何如 图 7-1 所 示 、 记 得 在 第 3 章 中 ， 我 们 把 基本 SQL 作为 一 个 通用 
的 标准 ， 加 上 了 一 些 会 共 的 标准 ， 如 XAOpen 和 SQL-99。 基 本 SQL 的 语法 仅 限 为 大 部 分 数据 库 
产品 能 够 实现 的 部 分 。 特 别 地 ， 我 们 提供 一 些 在 ORACLE、DB2 UDB 和 INFORMIX 三 种 产品 
中 非常 普 明 的 特征 。 值 得 一 提 的 是 创建 表 的 用 户 【 通 常 为 DBA ) 即 为 表 的 所 有 者 ， 这 对 我 们 
上 后面 讨论 的 数据 库 安 全 性 米 说 有 特殊 的 意义 。 

CREATE TABLE [schema.Jtablename 

t{columnname datatype [DEFAULT {default_ constant |MULLI] [eol _constr {col constr...}] 
| table. constr}-- choice of either columnname-definition or table_constr 


{, reolumnname datatype EDEFAULT (derfault_ constant NULLI] [eol_constr {col constr,..}] 


| table_constr] 
...}); -- Zero or more additional colummhrame- def or table. constr 


约束 单个 列 的 Col_const 形 式 如 下 ; 


{HOT NULL | -- tHh1s 1s the first of 8 set of choices 


[CONSTRAINT constraintname] -- if later choices Wsed, optionally name constraint 


UNIAUE -- the rest of the choices start here 
| PRIMARY KEY 
| EHECK (Search_cond) 
| REFERENCES tablename Lieolumnnamey] 
[ON DELETE CASCADE}) 


约束 守 个 列 的 table_constr 形 式 如 下 : 
[CONSTRAINT constraintname] 
{UNIQUE tcolumnname ff, columnname...}1} -- choose one of these clauses 
| PRIMARY KEY recolumnname [, columname...}) 
| CHECK fsearch_conditiony) 
| FOREIGN 长 EY tcolumnname [{, colummnname...l) -- following is all one clause 
REFERENCES tablename [tecolumnname {, columnname...}}] 
[ON DELETE CASCADE]I 





图 7-1 基本 SoL 的 Create Table 语 法 


从 图 7-1 可 以 看 出 ， 在 表 名 前 可 出 现 -- 个 可 选 的 语法 元 素 Eschema.]。7.4 节 中 对 模式 
(schemas) 进 行 了 介绍 ， 它 被 用 来 区 分 数据 库 中 同名 对 象 。 用 户 在 数据 库 中 为 表 或 其 他 对 象 命 
名 时 一 般 会 加 上 模式 名 (与 其 用 户 名 相同 )。 例 如 ， 用 户 escnei1 厅 能 有 一 个 叫做 custcomers 
的 表 ， 如 上 模式 后 的 全 各 为 eoneil.custcomers， 同 时 在 数据 库 中 还 有 叫做 
poneseil.customers 的 表 。 当 用 户 eoneil 用 customers 这 个 省 字 时 ， 指 的 是 表 
eoneil.,customers， 用 户 poneil 也 是 一 样 ， 这 样 斌 不 会 混 清 广 。 如 果 用 户 eoneii 有 相 
应 的 权限 ， 她 可 以 使 用 poneil .customers 访 问 椒 属于 她 的 模式 的 表 。 

下 面 我 们 先 定义 图 7-1 的 Create Table 语 句 中 的 一 些 子 句 ， 再 给 出 一 个 CAP 数 据 库 的 例子 。 
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然后 ， 我 们 说 明 在 DRACLE 和 DB2 UDB 中 的 一 些 特殊 的 语法 扩展 。 


定 交 7.1.1 Create Table 命 令 的 子 铅 图 7-1 的 Create Table 命 令 先 要 给 琢 信 各， 包括 表 名 
和 可 选 的 模式 和 名。 如果 模 式 名 没有 给 出 ,将 缺 省 地 把 执行 Create Table 命 令 的 用 户 名 作为 模式 
各 上 表 镍 之 后 的 图 插 苇 中 二 用 如 与 分 隔 的 列 定 义 或 表 约 束 的 序列 。 列 定 © 交 和 表 约 束 可 以 以 任 
何 顺 序 出 现 。 每 个 列 定义 包括 列 的 名 字 、 数 据 类 型 和 可 选 的 DEFAULT 子 句 。 当 SQL 的 Insert 语 
名 设 有 给 出 该 列 的 值 时 ， 就 用 这 个 子 司 的 缺 省 值 。《 注意 ， 装 人 大 基数 据 的 命令 ， 如 Load， 没 
有 包 合 在 SQL 标准 中 ， 所 以 不 要 求 给 出 缺 省 值 。 尽 管 有 些 傅 令 给 出 了 ， 但 这 不 是 必要 的 。 ) 提 
供 的 缺 省 介 可 以 是 正确 数据 类 型 的 常 值 ， 由 defaultvalue 或 NULL 给 出 。 

每 个 列 定 交 同 样 人 允许 有 蜀 约 未 ， 在 图 7-1 中 用 col_constrz 表 示 ，col_constr 包 含 -- 些 可 选 的 


子 名 序列， 具体 解释 如 下 ， 国 
定 光 7.1.2 ” 列 约束 ”图 7-1 中 Create Table 语 匀 中 出 现 的 col_constr 了 和 句 是 可 选 的 ， 对 应 于 
单个 的 列 。 


NOT NULL 的 情况 已 经 解释 过 了 上 ， 它 表示 列 中 不 能 出 现 空 值 。 如 果 col_constr 为 NOT 
NULL， 那 么 DEFAULT 子 句 不 能 指定 为 NULL。 如 果 在 列 定义 中 既 设 有 DEFAULT 子 句 ， 也 设 
有 NOT NULL 子 铝 ， 那 么 缺 省 地 使 用 PEFAULT NULL 。 

CONSTRAINT constraintname 子 可 可 以 为 除 NOT NUELEL 以 外 的 列 约 束 羡 名 ， 这 样 ， 我 们 
可 以 用 后 面 要 介绍 的 Alter Table 语 句 来 去 掉 某 些 约 束 ， 而 不 用 重建 整 张 表 . 

即使 没有 NOT NULL， 也 可 以 使 用 UNIQUE 约 束 子 句 ， 这 时 ， 该 列 中 所 有 的 非 空 值 必须 
是 唯一 的 ， 们 允许 多 个 空 值 同 时 存在 。 如 果 一 列 既 被 声明 为 NOT NULL 又 被 声明 为 UNIQUE， 
我 们 把 它 叫 敌 候 选 键 。 

PRIMARY KEY 子 名 指定 一 列 为 主键 一 -被 REFERENCES 子 句 中 的 另 一 个 表 缺 省 引用 的 
候选 键 。 有 PRIMARY KEY 约 束 的 列 被 隐 式 地 定义 为 NOT NULL 和 UNIQUE。 在 任何 Create 
Table 语 名 中 至 多 只 能 有 -~ 个 PRIMARY KEY 子 句 。UNIQUE 子 句 和 PRIMARY KEY 子 句 不 能 
用 在 同一 列 上 ， 但 PRIMARY KEY 子 句 和 NOT NULL 子 刨 可 以 一 起 用 。 实 际 上 ， 一 些 老 的 数 
据 库 产品 要 求 定 义 为 PRIMARY KEY 的 列 必须 是 NOT NULL 的 。 现 在 的 标准 已 经 不 这 人 么 要 求 
了 ， 但 为 了 保证 老 产品 的 健壮 性 ， 我 们 还 是 常常 照 这 个 习惯 做 。 

如 果 出 现 CHECK 子 句 ， 那 么 每 一 行 该 列 必须 包含 满 足 特 定 的 搜索 条 件 的 值 。( 在 X/Open 
标准 和 DB2 UDB 中， 搜索 条 件 只 允许 包含 常数 值 和 当前 行 特 定 列 的 值 的 引用 ， 其 他 列 的 引用 
或 集合 画 数 都 是 不 允许 的 。ORACLE 人 允许 引用 同一 行 中 的 其 他 列 。) 

如 果 一 到 用 REFERENCES tablename [ {columnname) |] 了 于 句 定 尺 ， 该 列 中 的 值 或 者 
为 空 或 者 是 在 被 引用 表 的 一 列 由 出 现 的 值 ， 被 引用 的 表 中 的 列 或 者 是 该 表 的 单列 主键 或 者 是 
在 REFERENCES 子 句 中 可 选 的 列 名 处 指定 的 列 。 被 引用 表 中 指定 的 列 的 值 必 须 是 唯一 的 ， 否 
则 包含 REFERENCES 了 于 句 的 Create Table 语 句 将 失败 (但 空 值 是 允许 的 )。 如 果 REFERENCES 
子 句 后 用 的 是 ODN DELETE CASCADE 子 句 ， 那 么 当 被 引用 表 中 一 行 被 删除 上 时， 被 引用 表 (有 
REFERENCES 了 于 名 的 表 ) 中 的 行 引 用 的 行 都 要 被 删 掉 然后 引用 表 中 的 这 些 行 詹 删除 。 如 梨 用 
的 是 NO PELETE 子 可 ,那么 被 引用 的 行 不 允许 被 删除 。 国 


例 7.1.1 上 而 是 一 个 可 能 的 customers 表 的 Create Table 语 刁 ]。 


create table customers {cid chartd} not mul1 unique,. crame 
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yarthart1l3}, city varcharteg， 
di1sent real constraint disent max check cdiscent = 15.0}): 


这 里 ，cid 被 突 义 为 表 customers 的 怪 选 键 ， 因 鸭 它 贰 有 NOT NULEL 子 句 ， 区 有 
UNIQUE 子 伸 ; 尽管 cigd 要 求 每 行 有 唯一 的 值 ， 这 并 不 代表 它 研 是 主键 ; 我 们 很 快 就 会 若 违 其 
依 芝 。 这 个 Create Table 语 句 辐 时 让 定 customers 表 中 每 : 行 的 discnt 值 不 能 起 过 153.0， 这 
个 约束 被 命 溃 为 discnt_max， 以便 以 后 可 以 用 Alter Table 语 但 去 皇 这 个 约束 。 人 我 们 不 能 
再 把 这 个 约束 如 回来 ， 而 对 命名 了 的 表 约 束 就 可 以 。 我 们 将 会 看 到 ， 可 以 把 这 个 约束 改 成 更 
普遍 的 表 约 束 形 式 ， 加 


定 久 7.1.3 表 约 束 下 面 列 出 图 7-1 的 Create Table 语 句 中 的 table_constr 子 句 中 除了 指定 
列 的 NOT NULL 形 式 外 ，col-constr 形 式 仅 是 tabIe_const 的 特例 。 

UNIQUE 子 句 和 col_constr 中 的 UNIQUE 含 义 是 相同 的 ， 但 在 表 中 可 以 规定 多 个 列 的 组 合 
值 唯 --。 因 此 这 是 为 表格 指定 多 列 民 选 键 的 一 种 为 法 ( 曙 然 我 们 可 以 只 指定 一 列 ， 再 用 同样 
方法 以 表 约 东 人 代替 列 约 东 小 

PRIMARY KEY 子 钉 指 定 一 组 非 空 的 烈 作为 主键 一 一 被 REFERENCES 了 名 中 的 另 一 个 表 
缺 省 引用 的 候选 键 。PRIMARY KEY 子 名 中 的 每 个 列 都 必须 是 NOT NULL 的 。 在 任何 Create 
Table 讲 名 中， 至 多 只 能 有 一 个 PRIMARY KEY 子 句 ， 不 管 该 子 句 是 到 约束 还 是 表 约 束 ， 

如 果 表 格 中 的 几 列 被 定 头 为 UNIQUE， 而 日 其 中 的 每 一 列 都 单个 定义 为 NOT NULL .我 
们 称 它 们 为 候选 键 ， 

表 约 束 中 的 CHECK 子 句 与 列 约束 中 的 CHECK 子 名 类 似 ， 用 来 限制 一 组 列 的 值 ， 搜索 条 
件 可 以 取 同 一 表 中 正在 进行 Update 或 Insert 操 作 的 同 -- 行 的 任何 列 的 值 。 与 在 到 约束 中 讨论 过 
的 一 样 ， 在 X/AOpen 标 准 中 ， 子 查询 或 集合 为数 都 是 不 允许 的 。 扩 展 的 SQL-99 标 准 的 一 个 显著 
特征 就 是 允许 在 CHECK 子 句 中 包含 子 查 询 ， 并 且 这 种 扩展 能 力 是 很 强 的 ， 但 大 多 数 的 数据 库 
产品 ， 包 括 ORACLE 和 DB2 UDB， 都 不 支持 这 种 扩展 。 

FOREIGN KEY ,,REFERENCES...[ON PELETE...] 子 名 是 一 个 具有 这 个 序列 中 的 关键 字 
的 单个 子 句 。FOREIGN KEY 列 名 列表 指定 正在 创建 的 表 中 的 列 序列 ， 如 果 表 中 共 行 的 这 上 几 个 
列 的 值 都 非 空 ， 那 么 这 些 列 的 值 被 约束 为 与 由 REFERENCES 子 名 指定 的 曙 -个 表 中 的 其 行 的 
对 应 列 的 值 相等 。 当 被 引用 表 中 的 列 构成 了 主键 时 ，REFERENCES 子 名 不 必 给 出 列 的 列表 
如 果 FOREIGN KEY 列 名 列表 中 的 列 值 中 的 一 个 在 某 行 的 值 为 实 ， 那么 好 那 一 行 的 该 列 值 没有 
限制 。 

可 选 的 ON DELETE CASCADE 地 名 指出 ， 当 被 引用 表 的 行 被 删除 时 ， 导 致 引用 表 中 所 有 
引用 它 的 行 也 要 被 删除 。 这 个 行为 看 上 去 有 点 太 邮 格 了 ,但 从 有 这 样 直 能 满足 约束 。 如 打 没 
有 这 个 子 句 ， 被 引用 的 行 是 不 能 被 删除 的 ， 

在 本 节 的 稍 后 部 分 有 关于 主键 、 外 键 和 参照 完整 人 性 等 概念 的 详细 描述 。 轿 

于 面 是 一 个 说 明 这 些 概念 的 例子 

例 7.1.2 。 我们 给 出 在 CAP 数 据 库 中 创建 customers 和 orders 表 的 命令 。 表 定义 基于 图 
7-2 所 示 的 E-R 图 ， 这 个 E-R 图 是 第 6 章 后 习题 6.2 的 答案 。 前 面 讲 过 ， 属 忻 A 和 实体 FE 之 问 连 线 
上 的 (x,y) 表示 x = min-card (A, E)，y = max-card (A, E)。 特 别 地 ，x = 0 表示 这 列 中 人 允 
许 空 值 出 班 ，x = 1 表示 该 列强 制 参 与 ， 在 Create Table 语 名 中 ， 该 列 必 须 用 NOT NULL 子 句 定 
疼 。 每 个 实体 的 标识 符 属性 都 在 E-R 图 中 用 下 划 线 标 出 了 ， 这 通常 对 应 于 Create Table 语 何 中 
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的 PRIMARY KEY 子 句 。 在 Create Tabie 语 名 中 ， 我 们 还 如 上 了 -一 些 CHECK 子 句 ， 这 在 E-R 移 
中 没有 对 应 的 部 分 。 表 oraers 中 的 FOREIGN KEY...RFEFERENCES 子 句 ， 我 们 在 本 节 的 后 面 


谈 到 参照 完整 性 时 再 讨论 。 
(0, 1) (1, 4 
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图 7-2 _ CAP 数据 库 的 E-R 图 


create table customers tcid chartdy not null, cname varcharrt13), 


city varchar tz, 
discnt real constratnt discnt_max checktdiscnt <= 15.0}., 


primary key dcid}y: 


create table orders fordno integer not null, month chart3), 
cid chartdy not nul1。 aid chart3) not null, pid chart3} not null, 
qty integer not nult constraint qtyck checkiqty ?= O01, 
dollars float default .0 constraint dollarsck checkidollars > 一 0O.0}., 


primary key Cordno}, 

constraint cidref foreign key etd) references customers,. 
Constratnt aidref Toreign key Caid) references dB9ents, 
constraint pidref foreign key (pid) references products): 


表 oraers 的 约束 ， 将 在 例 7.1.3 中 讲 到 如 何 从 E-R 图 中 产生 参照 完整 性 时 再 解释 。 | 


在 下 面 的 小 节 中 ， 我 们 讨论 在 数据 库 产品 ORACLE 和 DB2 UDB 中 如 何 加 入 约束 ， 这 与 基 
本 SQL 标 准 栈 有 不 赔 。 

(1) ORACLE 的 Create Table 语 句 

ORACLE 的 Create Table 语 句 队 了 支持 如 图 7-1 所 示 的 基本 SQL 语法 中 的 所 有 完整 性 约 曙 子 
侣 【col_constr 和 table_constr 子 句 ) 外 ， 还 加 和 人 了 如 图 7-3 所 示 的 ENABLE 和 DISABELE 子 何 。 
ORACLE 还 有 一 点 与 基本 SQL 语法 不 同 ， 它 允许 在 NOT NULL 之 前 出 现 可 选 的 约束 和 名， 这 样 
列 约束 NOT NULL 也 可 以 用 Alter Table 语 名 去 掉 。 些 外，ORACLE 中 除了 有 NOT NULL 外 ， 
还 有 NULL 约 东 ， 

注意 到 图 7-3 中 Create Table 语 句 有 两 种 形式 。 每 种 形式 都 有 disk storage and other 
clauses( 碘 盘存 储 及 其 他 子 句 )， 定 浆 表 的 每 一 行 在 磁盘 上 如 何人 存储 。 这 些 子 句 将 在 第 8 章 中 
讨论 。 

图 7-3 Create Table 的 第 二 种 形式 中 ， 有 一 个 AS 子 查询 语句 ， 用 户 可 以 用 对 其 他 表 的 查询 
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结果 来 创建 表 。 新 表 的 列 名 和 数据 类 型 可 以 从 子 查询 的 目标 列表 中 继承 得 到 (假定 列 的 别名 
可 以 在 表达 式 中 出 现 )， 这 样 Create Table 命 令 中 的 列 名 各 数据 类 型 就 可 以 省 上 咯 了 。 注 意 列 约束 
和 表 约 束 不 能 被 继承 ， 即 使 是 单个 表 的 子 肖 询 也 不 行 。 如 果 用 户 想 定 尺 这 样 的 约束 作为 Create 
Table 合 名 内 一 部 分 ， 必 须 模 定 列 名 【但 数据 类 型 还 是 可 以 省 上 略 的 )。 


CREATE TABLE [schema., tabliename 
tf... as in Baste SOL, except with CHOT HULL) 
Ldisk storade ard ther clauses tnot covered, or deferred)] 
| CREATE TABLE tablename 
t... as in Basic SOL, columnnames and datatypes can be ieft out 1f no 
constraints are specified} 
[disk storage and other clauses nat Covered, or deferred)] 
A subquery; 


约束 单个 列 值 的 Col_consu 形 式 如 下 ; 


,as in Basic $0L 
[ENABLE and DISABLE clauses for constraints]: 
[storage and transactinn specifications]: 


一 次 约束 多 个 州 的 table_consu 形 式 如 下 : 


:a5 1n Basic SOL 
[ENABLE ard GISABLE clauses for constraints]: 
[storage and transaction specifications]: 





图 7-3 ORACLE 关 系 Create Tablei 琴 法 (无 对 象 关系 扩展 ) 


注意 ，ENABLE 种 DISABLE 子 句 允 许 用 户 定 闵 一 个 约 呆 ， 然 后 在 创建 表 前 使 它 无 效 ; 如 
果 没 有 一 个 子 句 出 现 DISABLE 约 束 ， 那么 甬 省 值 为 ENABLE。 用 Alter Table 命 令 可 以 使 约束 
重新 有 效 。 这 种 ENABLE/DISABLE 能 力 的 唯一 问题 是 ， 它 不 适用 于 其 他 产品 ， 我 们 上 织 有 在 
Alter Table 命 令 中 使 用 别 的 方法 才能 近似 地 实现 这 --- 功 能 。 想 了 解 ORACLE 中 Create Table 语 
各 的 更 多 细节 ， 请 参阅 附录 C 或 《ORACLES8 Server SQL Reference Manual》(《ORACLE8 服 务 
SQL 参考 手册 如 【 参见 本 章 最 后 的 “推荐 读物 ”[13] )。 

(2) INFORMIX 的 Create Table 语 们 

INFORMIX 的 Create Table 语 名 支持 如 图 ?-1 所 示 的 基本 SQL 语 法 中 的 所 有 子 名 ， 只 有 … 点 
不 同 : INFORMIX 要 求 所 有 的 列 定 义 在 表 约 东 和 证 信之 前 出 现 ， 而 图 7-1 允 评 呐 者 以 任意 顺序 出 
现 。 如 图 7-3 所 示 ，INFORMIX 的 Create Table 语 句 中 也 有 对 针对 产品 的 “disk storage and other 
clauses"。 它 有 与 ORACLE 形式 相同 的 对 约 曙 的 ENABLE/DISABLE， 在 这 里 我 们 没有 把 它们 
列 出 。 起 了 解 INFORMIKX 的 Create Table 语 句 的 更 多 细节 ， 请 参阅 附 如 C 或 《INFORMIX Guide 
to SQL》(《INFORMIX SQL 指 南 》) ( 见 本 章 最 后 的 “推荐 读物 ”[8] )。 

(3) DB2 UDB 的 Create Table 语 与 

DB2 UDB 的 Create Table 诸 句 支 持 基 本 SQL 语 法 中 的 了 护 有 子 句 。 它 同样 有 对 针对 产品 的 
“disk storage and other clauses”， 我 们 将 在 第 8 章 中 介绍 。 表 约 东 的 FOREIGN KEY 
REFERENCES 子 句 有 更 多 的 项 供 选择 ( 如 后 面 的 图 7-6 所 示 )。 想 了 解 DB2 UDB 中 人 Create 
Table 说 句 的 婚 多 细节 ， 请 参 位 有 附 杂 CC 或 《DB2 Universal Database SQL Reference Manualy 
(DB2 UDB 通 用 数据 库 SQL 参 考 手册 》) ( 见 本 章 最 后 的 “推荐 读物 ”的 推荐 读物 [4] )。 
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2. 主键 、 外 键 和 参照 完整 性 

这 .~ 部分， 我 们 将 解释 图 7-1 中 的 FOREIGN KEY...REFERENCES 了 于 各、 以 及 隐 舍 的 完整 
性 约束 ( 称 为 参照 完整 性 约束 ) 是 如 何在 更 新 语句 上 强制 实施 的 。 我 们 用 CAP 数 据 库 中 的 一 
个 例子 来 引出 定义 7,1.4 中 的 参照 完整 性 的 定义 。 


例 7.1.3 参照 完整 性 ”在 如 图 7-2 所 示 的 CAP 数 据 库 的 E-R 图 中 ， 所 有 的 关系 requests， 
places 和 ships 都 基 多 对 一 的 ，Crders 空 体 与 多 个 实体 有 联系 《参见 定义 6.2.2), 一 个 顾 
客 可 以 用 个 订单 ， 每 个 代理 商 也 有 多 个 订单 .每 个 产品 可 能 在 多 个 订单 中 出 现 、 但 一 个 订 
单 只 能 对 应 一 个 确定 的 顾客 、 代 理 商 和 产品 。 因 此 在 6.2 节 的 转换 规则 4 中 ，orqders 艇 应 该 包 
会 一 个 外 键 的 列 米 表示 与 Draers 实 例 相关 的 每 个 Customers，aRgents 和 Broaucts 实 例 。 
例如 ， 例 7.1.2 中 Create Table 语 和 剧 的 orders 表 包含 -一 个 外 键 ciqd， 说 有 明 Customers 实 例 
需要 这 行 特 定 的 订单 来 表示 .特别 注意 到 corders 表 中 的 询 cid 并 小 表示 or9Gers 实 体 的 属性 ， 
而 是 表 小 requests 头 系 的 一 个 实例。 

这 上 是 一 个 非常 重要 的 概念 ， 所 以 我 们 重复 了 和 好几 次 ， 每 次 赂 有 不 同 : ordaers 表 竺 一 行 的 
每 个 特定 的 cia 值 都 对 应 着 一 个 联系 着 Drders 实 体 和 Customers 实 体 的 联系 实体 。 参 照 完 
整 性 约束 要 求 我 们 六 免 奸 键 指向 其 他 表 中 不 存在 的 主键 这 种 “最 挂 ” 引 用 ， 这 就 保 让 了 表 
orders 中 每 .一行 的 联系 实例 都 是 有 意义 的 。 所 以 orders 表 中 的 cid 值 也 必须 在 customers 
中 存在 。 讽 7.1.2 中 ， 这 个 约 上 吕 是 在 创建 orders 表 时 ， 用 orders 约 Create Table 语 创 中 的 
forseign key (cid) references customers 子 名 保证 的 。 

cid 还 有 一 个 约束 是 基 十 图 7-2 中 rders 实 体 必 须 在 requests 联 系 中 强制 参与 {因为 连 
撞 0rders 初 requests 的 连 线 上 的 标 问 的 min-card 于 人 因此 ，ordersg 中 的 每 一 行 的 
ciad 值 必须 非 空 (这 与 参 昭 完整 性 有 明显 不 同 ， 参 照 完整 性 要 求 每 个 非 衬 的 cid 值 必须 引用 
customergs 中 一 个 真实 存在 的 cidqa 值 )。 ee 
Table 的 cid 定 义 后 的 NOT NULL 子 句 的 定义 实现 的 。 加 

再 重复 一 下 : 参照 完整 性 定义 了 一 条 规则 ， 即 CAP 数 据 库 中 表 coraers 没 有 哪个 行 包 傅 
cid，aiad 或 pia 值 除非 它 措 表 custoemers，agents 或 proeduccs 表 中 存在 。 这 茶 规 则 基 
本 的 意思 是 当 我 们 往 ordaers 中 播 人 行 时 ， 应 该 避免 出 现 如 下 的 申明 “尽管 这 条 命令 中 引用 的 
是 一 个 不 存在 的 代理 商 ( 或 产品 、 顾 客 ), 但 一 有 机 会 我 就 会 在 agents 表 中 插入 一 行 , 使 这 
个 引用 变 得 有 效 "。 我 们 强调 必须 先 在 agents 中 捕 人 行 ， 再 在 orders 中 对 它 进行 引用 。 我 
们 使 用 完整 性 约束 是 出 于 逐 辑 设计 的 基本 考虑 ， 但 在 实际 应 用 中 非常 有 效 。 如 采 有 人 试图 机 
orders 中 吉 入 一 个 木 存 在 的 引用 值 ， 这 可 能 意味 首 某 人 在 往 表 orders 中 输入 数据 时 有 八 误 。 
例如 ， 考 虚 将 如 下 所 示 的 一 行 捕 入 到 表 orders 中 。 





在 aqents 的 主键 中 ， 没 有 aid 值 等 于 “a0@” 的 ; 这 可 能 意味 着 在 输入 orders 的 aiq 
列 时 出 错 了 输 2 的 时 候 误 按 了 Shift 键 ， 所 以 得 到 了 “@”)。 似 乎 并 没有 理由 要 求 cid，aiq 
或 bid 在 orders 中 第 一 次 出 现时 就 是 正确 的 ; 但 我 们 有 理由 规定 一 个 新 的 顾客 、 代 理 商 或 产 
品 必须 先 在 相应 的 被 引用 表 中 出 现 ， 这 样 有 利 寸 我们 发 现 重要 的 错误 。 当 然 参 照 完整 性 约束 
会 降低 性 能 ， 加 上 像 这 样 的 二 个 参照 完整 性 规则 后 ， 在 表 craers 中 执行 插 人 操作 所 用 的 资源 
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将 大 受 影 响 ， 因 为 每 … 次 插入 操作 都 逢 要 查找 二 个 下 的 主键 。 

现在 让 我 们 溢 清 忠 路 来 下 一 个 定义: 参照 完整 性 约 昌 要 求 数据 库 某 个 表格 中 的 外 键 值 必 
须 与 另 一 个 表格 中 的 主键 值 相 臣 配 ( 也 可 能 引用 的 是 同一 个 表 ， 例 如 表 emp1oyees 的 主键 是 
eid， 通 过 列 mgria 引 用 共 他 一 些 雇 员 的 eiq )。 对 于 空 值 我 们 怎么 办 呢 ?” 我 们 知道 空 值 是 不 
能 在 主键 中 存在 的 ( 参见 2.4 节 的 RULE 4 实体 完整 性 规则 ， 以 及 定义 7.1.2 最 后 的 PRIMARY 
KEY 子 句 )。 对 于 外 键 中 的 空 值 ， 我 们 应 该 采用 什么 样 的 规则 呢 ? 在 DB2 UDB (如 图 7-6 所 下 ) 
的 ON DELETE 圾 约束 子 句 中 有 一 个 动作 是 ， 当 主键 的 值 被 删 控 时 , 将 一 行 中 的 外 键 值 置 为 空 ， 
也 就 是 说 ， 数 据 库 产品 允许 空 值 存在 十 外 键 中， 但 我 们 必须 行 细 地 给 出 一 个 定义 。 


定义 7.1.4 外 键 ， 参 照 完 整 性 ”如果 表 T1 中 任意 行 的 F 值 的 组 合 ， 至 少 包 含 一 个 空 但 或 与 
被 引用 表 了 2 中 为 候选 键 或 主键 的 列 集合 P 的 组 合 值 匹配 ， 则 列 集合 F 被 定义 为 外 键 。 换 侣 话说 ， 
如 时 表 T1 的 每 一 行 中 F 的 列 都 满足 ( 1 ) 至 少 有 一 列 为 空 值 ( 如果 该 列 允 许 为 空 ), (2 1 如 果 椒 
包含 空 值 ， 就 必须 与 表 T2 中 某 行 的 相应 P 的 组 合 值 相等 ， 则 参照 完 整 性 约束 是 有 效 的 。 国 

注意 ， 外 键 中 的 某 些 列 可 能 还 参与 构成 这 个 表 的 候选 链 战 主键 ， 因 此 不 能 为 空 ， 也 就 是 
说 它们 出 现在 Create Table 语 句 的 NOT NULL 或 PRIMARY KEY 子 句 中 。 但 是 ， 定义 7.1.4 暗 示 ， 
如 果 外 键 支 持 的 关系 是 可 选 参 与 ， 则 外 键 中 至 少 有 一 列 的 值 必须 为 可 空 的 ， 以 表示 关系 实例 
的 存在 ; 如 果 册 于 候选 键 上 的 SET NULL 动 作 删 除了 主键 ， 便 联系 实例 不 再 有 效 ， 那 么 这 个 
可 以 为 空 的 列 中 出 现 空 值 意 味 者 整个 外 键 是 无 效 的 ， 即 为 衬 。 

例 7.1.4 ”在 2.2 革 中 我 们 曾经 说 过 一 个 属性 的 域 通 常 被 看 做 是 将 甩 存 可 能 值 术 举 出 来 得 到 
的 集合 。 枉 实际 上 大 部 分 数据 库 都 不 文 持 这 种 仿 举 类 型 。 例 如 ，custemers，agents 和 
products 中 的 city 列 只 是 简单 地 被 约束 为 字符 串 型 ， 因 为 要 人 麟 出 所 有 正确 的 城市 名 是 不 可 
能 的 。 但 如 果 本 创建 一 张 叫 做 cities 的 新 表 ， 我 们 还 是 可 以 提供 核 举 类 型 的 功能 ， 列 出 所 有 
可 以 接受 的 城市 名 。( 在 不 同 的 州 或 国家 中 ， 同 一 个 城市 各 可 能 出 现 儿 次， 假定 我 们 先 不 淮 虑 
这 些 ;: 为 简单 起 见 ， 在 原先 那个 例子 的 表 中 ， 我 们 不 考虑 州 和 国家 ， 这 样 ， 如 何 建立 城市 - 
州 的 对 应 的 问题 融 非 常 明 了 了 ，) 

create table cities fcity varchart20) not null, 

primary key Lcity} ); 
create table customers (cid chartd) not null, cname varchar(tl3}. 
city varchart20}, discnt real checktdiscnt = 15.07. 


primary key {cid). 
forsign Key (city) referances citiesy; 


表 cities 中 的 city 值 是 唯 : -的 ， 可 以 作为 主 刍 ， 而 表 customers! 的 city 值 相 个 
从 键 ， 必须 与 表 cities 中 的 某 个 (主键) 值 匹配 。 这 个 约束 保证 了 表 customers 中 的 城市 
名 都 是 在 表 cities 中 列 出 来 的 ,这样 就 有 了 朴 举 域 的 效果 。 图 

完整 性 约束 保证 了 在 执行 写 得 不 好 的 Update 语 名 时 数据 的 完整 性 。 外 键 约束 对 行 更 新 施 
加 了 哪些 限制 呢 ? 应 该 做 哪些 测试 以 保证 一 致 性 呢 ? 在 图 7-1 的 ON DELETE 子 名 中， 动作 
CASCADE 指 定 ， 如 果 被 引用 的 主键 表 中 有 一 行 被 删除 ， 那 么 其 他 表 中 引用 该 行 作为 外 键 的 所 
有 行 都 必须 被 删除 ， 但 可 能 发 生 的 情 癌 不 止 这 一 种 。 考 虑 用 于 行 更 新 的 一 种 SQL 诸 句 一 一 
Insert、Delete 和 Update， 以 及 可 能 被 改变 的 两 列 一 一 一 个 表 中 的 主键 利 另 一 个 表 的 引用 外 键 。 
用 二 检查 是 各 违背 了 完整 性 约束 的 必要 测试 如 图 7-4 的 表 上 所 示 。 
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Jnsert Delete Update 


图 7-4 参照 完整 性 测试 的 表格 


表 中 标识 为 “no test” 的 单元 表示 不 会 破坏 完整 性 约束 的 情况 ，。 例 如， 如 果 外 键 的 所 有 值 
组 合 与 主键 的 值 组 合 对 应 ， 那 么 插入 包含 一 个 新 的 主键 值 的 行 就 不 会 破坏 这 -一 特性 。 相 反 ， 
表 中 标识 为 “test-1” 至 “test-4” 的 单元 表示 ， 在 这 种 情况 下 ， 系 统 需要 进行 测试 以 保证 这 类 
更 新 操作 不 会 破坏 人 参照 完整 性 。 例 如 ， 当 从 主键 中 删除 一 行 时 《test-1})， 我 们 可 能 删 掉 了 一 
个 正 被 其 他 表 的 某 些 行 作为 外 键 引用 的 主键 值 (这 由 我 们 已 经 讨论 过 的 QON DELETE 子 句 解 
决 )。 对 主键 的 更 新 闻 样 可 能 使 正在 被 引用 的 主键 值 改变 ，DB2 UDB 中 的 ON DELETE 子 句 
( 后 面 将 讨论 ， 如 图 7-6 所 示 ) 就 是 被 扩展 来 处 理 这 种 情 阅 的 。Full SQL-99 标 谁 中 有 一 个 ON 
UPDATE 子 句 用 来 控制 这 种 情况 ，DB2 UDB 中 同样 提供 了 这 样 的 ON UPDATE 子 句 。 

显然 ， 当 同 外 键 表 中 插入 一 行 时 (test-3 )， 我 们 必须 验证 它 是 否 引 用 了 一 个 合法 的 主键 ， 
同样 ， 对 外 键 所 在 列 进 行 修改 时 【test-4 ) 也 需要 验证 。 当 插入 - - 行 时 ， 要 执行 这 些 测试 是 可 
以 理解 的 。 如 果 未 通过 测试 ， 缺 省 的 动作 为 NO ACTION， 即 不 允许 执行 那些 可 能 产生 非法 外 
键 的 插入 和 修改 操作 。 从 执行 的 测试 类 型 来 看 ， 只 对 很 少 的 一 些 情 沈 应 用 参照 完整 性 可 能 是 
出 于 效率 的 考虑 。 例 如 ， 当 在 例 7.1.4 的 表 customers 中 捅 人 一 行 时 ， 系 统 附带 的 重要 责任 是 
查 表 cities 的 city 值 ， 该 表 可 能 包含 几 千 条 记录 。 这 确实 是 DBA 需 要 的 功能 ， 但 必须 慎重 
考 虚 ， 因 为 为 此 付出 的 代价 是 在 一 定 的 硬件 配置 下 更 新 能 力 的 下 降 。 图 7-5 列 出 了 我 们 已 经 讨 
论 过 的 SQL 语 名 和 它们 与 测试 、 动 作 之 问 的 关系 。 










Update 


ONDELETE... 或 

ON UPDATE... 
或 缺 省 ”NO 

ACTION 








Insert 


ON DEFLETE. . . 
主键 (被 外 键 引 用 ) 无 须 铀 试 或 页 省 NO 
ACTION 


外 刍 必要 时 语 杀 失败 无 须 测试 必要 时 语句 失败 







图 7-5 给 出 特定 动作 的 参照 完整 性 淹 试 和 SQL 子 句 


3. 不 同 产 品 中 的 外 键 约 来 
大 部 分 的 数据 库 产品 都 支持 如 图 7-1 所 示 的 基本 SQL 的 FOREIGN KEY 子 句 : 


| FOREZON KEY tcolumnname {, columnname...}) 

REFFRENCES tablename [tcolumnname {, columnname...17)] 
[ON DELETE tASCADE} 

对 应 于 多 列 的 FOREIGN KEY 子 句 在 被 引用 表 中 只 能 特 指 一 列 。 在 上 面 的 讨论 中 ， 我 们 注 
意 到 当 ON DELETE 子 句 设 有 出 现时 ， 缺 省 的 动作 是 NO ACTION ， 这 意味 着 当 违 反 约束 的 删 
除 操 作 失 下 时 ， 动 作 不 能 发 生 。 图 7-6 显 示 X/Open、Full SQL-99 和 DB2 UDB 人 允许 约束 中 出 现 
显 式 的 NO ACTION 说 明 ， 而 GRACLE 和 INFORMIX 中 只 有 无 ON DELETE 子 句 时 才 担 供 。 


J 
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X/Open, Full SQL-99 
NO ACTION 


ORACLE, INFORMIX | DB2 UDB 
























NO ALUTION ICASCADE 
[CASCADE IsSET NULL 
CASCADE ISET NULL BET DEFAULT 





ION DELETE... SET NULL IRESTRICT RESTRICT ISQL-39 only} 


图 7-6 各 产品 和 标准 中 党 键 约束 可 用 的 ON PELETE 动 作 


DB2 UDB 支 持 除 SET DEFAULT 外 完全 SQL-99 定 义 的 所 有 ON PDELETE 语 法 。 例 如 ， 肯 
orders 的 外 键 ciq3| 用 的 是 表 customers 的 主键 。 当 执行 Delete 语 名将 表 customerg 的 一 
行 删除 ， 而 该 行 的 cid 值 正 被 表 orders 的 某 些 行 引 用 时 ， 应 该 相应 地 做 些 什 么 动作 呢 ? DB2 
UPB 允许 的 四 个 动作 是 NO ACTION、CASCADE、SET NULL 和 RESTRICT。 如 果 用 
CASCADFE， 当 表 customers 中 包含 禁 个 给 定 ciqd 慎 的 行 蕉 删除 时 ， 表 orders 中 上 所 有 3 引用 
该 cid 值 的 行 都 必须 被 删除 ， 与 这 些 行 有 级 联 的 外 键 依 赖 关 系 的 行 也 要 删除 。 如 果 用 NO 
ACTION 或 RESTRICT， 将 不 允许 删除 表 customers 中 的 行 【《 这 两 者 之 问 有 细微 的 差别 ) ; 
如 果 没 有 特 指 ，NO ACTION 将 作为 缺 省 动作 。 如 果 用 SET NULL， 那 么 当 表 customers 的 行 被 
删除 后 ， 表 oraers 中 引用 这 一 行 的 cia 值 将 鹤 置 为 室 。( 表 cordaers 中 的 列 cia 不 能 用 NOT 
NULL 或 PRIMARY KEY 说 明 。) 如 果 FOREIGN KEY 定 处 中 不 包含 ON DELETE 子 名 ， 则 缺 省 
使 用 ON DELETE NO _ ACTION 选项。 在 SQL 标准 (还 有 DB2 UDB ) 中 ,ON DELETE NO 
ACTION 也 是 未 给 出 ON DELETE 子 名 时 的 缺 省 动作 。 

二 . 和 lter Table 语 多 

Alter Table 语 可 允许 DBA 改 变 原 先 在 Create Table 语 侣 中 定 交 的 表 的 结构 ， 加 人 或 改 灾 列 、 
加 入 或 删除 各 种 约束 等 。 执 行 Alter Table 语 名 的 必须 是 表 的 所 有 着 【在 有 些 产品 中 ， 世 可 以 是 
有 收 改 权限 的 用 户 )， 可 能 还 需要 有 其 他 权限 。 我 们 将 在 本 章 的 后 面 -一 节 介 绍 这 类 权限 。 

在 老 的 标准 中 没有 定 头 Alter Table 语 句 。 因 此 ，ORACLE，DB2 UDB 和 INEFORMIX 提 供 
的 一 些 特性 在 语法 上 略 有 不 同 。 鉴 于 Alter Tabls 语 名 在 实际 应 用 中 不 断 完善 。 没有 一 个 标准 能 
对 它 进 行 很 好 的 描述 ， 我 们 也 不 给 出 它 的 基本 SQL 标准 的 形式 ， 而 是 给 出 厂商 提供 的 形式 。 

可 以 看 到 在 图 7-7、?7-8 和 7-9 的 Alter Table 语 名 中 ， 约 束 的 名 字 的 用 处 。 如 果 表 约束 被 傅 了 
名 ， 表 所 有 省 可 以 用 这 个 名 字 DROP 该 约束 。 用 APD 子 名 可 以 加 上 一 个 新 定义 的 下 约束 。 
ADD 子 句 的 操作 对 象 不 能 为 列 约束 ,不 过 列 约束 实际 上 是 表 约 束 的 特例 ， 所 以 可 以 用 这 种 方 
式 如 和 人 大 和 多 数 这 样 的 约束 { 除 NOT NULL 外 )。 在 ORACLE 中 ， 可 以 用 ENABLE 和 和 DISABLE 
子 句 启用 和 禁用 一 条 约束 ， 即 打开 和 关闭 约束 ， 只 要 它 在 数据 库 中 有 定义 。 在 这 里 ， 我 们 不 
研究 这 个 特征 ， 因 为 它 不 可 在 数据 库 产 品 之 闻 移 植 。 一 种 可 称 种 的 方法 是 用 DROP 去 掉 … 个 有 
名 字 的 约束 ， 以 后 再 用 ADD 把 它 加 回来 。 

ORACLE 、DB2 UDB 和 INFORMIX 的 功能 基本 相同 ,但 语法 上 有 些 差 异 。 例 如 ， 图 7-7 所 
示 的 ORACLE 的 ALTER TABLE 语 句 ， 要 求 ADD 和 MODIFY 了 于 名 中 的 “colymnname datatype” 
元 素 用 大 括号 括 起 来 ; 图 7-9 的 INFORMIX 形 式 既 允许 用 括号 将 一 列 由 如 导 分 隅 的 数据 类 型 括 
起 来 ， 也 允许 单个 元 素 不 用 括号 括 起 来 ; 而 图 7-8 的 PDB2 UDB 不 需要 括号 。ORACLE 和 
INFEORMIX 都 有 删除 一 列 的 能 力 { 这 是 现今 的 所 有 标准 都 支持 的 )， 但 PDB2 UDB 却 不 提供 。 
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ORACLE 有 修改 一 列 的 能 力 。 (DB2 UDB 同 样 有 一 种 方法 通过 改变 列 的 最 大 长 度 米 改变 列 的 
属性 ， 但 图 7-8 中 没有 了 包含 这 条 语句 ,) 


ALTER TABLE tablename 
[ADGD {CDOTUMmnne He 
[DEFAULT {default constant|NULL}Y] [cot constr {col_ constr...1] | table_constr) 
{. coliumnname datatype 
[DEFAULT ledefault constant|NULL}Y [eal_constr Leol constr...1] 1 table constrl 
..-.1»] -- ZepD or more ddded columnname-def er table _ constr 


[DROF ICOLUMN columnname | tcolumnname {, columnname...}}}] 


[MOBIFY Ceolumnname data-type 
{DEFAULT tdefault_constant |NULLI] [LINOT] NULL] 
[, columnname data-type 
EDEFAUET Ldefault_ constant |NULL}] CLNOT] NULL] 
...})] 
[DROFP CONSTRAINT constr_name] 
[DROP PRIMARY KEY] 
[disk storage and other clauses 【not covered, or deferred}] 
[any clause abovwe can be repeated, in erny order] 
[ENABLE and DISABLE clauses for constraints]; 





图 7-7 ORACLE 中 Alter Tabje 语 句 的 棚 式 


ALTER TABLE tablename 
LADD [EOLUMN] columnname datatype 
[DEFAULT fdefault constant |NULL)] [eo]l_constr (col constr,..}] 
[ADD table_constr] 
[DROP CONSTRAINT constr name] 
[OROP PRIMARY KEY] 
[repeated ADD or DROP clauses, in any order] 
[disk storage and other clauses (net covered, or deferred)]: 





图 7-8 DB2 UDB 中 Alter Table 语 法 的 形式 


ALTER TABLE tablename 
[ADD new_col | (new_col (, New_col...}}] 
[DROP columnname | tecolumnname {, colummname...1)] 
[ADD CONSTRAINT table constr | (table constr 1, table constr.,..})] 
[DROP CONSTRAINT constraintname | tconstraintname {. constraintname...t}] 


[repeated ADD or DROP clauses,. in any order] 
[disk storage and other Clauses (not covered, or deferred)]: 


芍 率 半 个 别 值 的 new_eel 拱 式 如 下 : 


columname datatype 
[DEFAULT {default_constant NULLY] [col constr {col_ constr...}] 





图 7-9 INFORMIX 中 AAlter Table 语 法 的 形式 


加 入 一 个 原先 不 存在 的 约束 ， 如 为 表格 设置 主键 或 将 原来 包含 空 值 的 一 列 曾 为 非 空 
(ORACLE 中 这 只 能 在 列 的 MODIFY 子 句 中 出 现 )， 通 常 结果 是 什么 都 不 做 (NO ACTION ) 即 
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该 证 何不 刷 执行 。 DROP PRIMARY KEY 寺 名 在 ORACLE 和 DB2 UDB 中 有 ， 在 INFORMIX 中 
没有 有。 但是， 如果 事先 为 这 个 约束 命 了 名 ， 在 任何 一 个 产品 中 都 可 以 去 除 它 。 

如 本 要 了 解 所 用 产品 的 Alter Table 讲 句 的 确切 形式 ， 请 读者 查阅 相应 的 SQL 参 考 于 册 。 

注意 ， 如 果 用 Aiter Table 语 名 加 入 一 个 新 禾 ， 必 须 先 置 好 所 有 的 空 值 或 缺 省 值 ， 天 此 这 
一 列 不 能 被 定义 为 NOT NULL， 际 非 已 经 设置 了 缺 省 值 。 向 表 中 加 入 新 的 列 将 影响 行 的 物理 
存储 ， 因 为 行 天 小 的 脱 胀 可 能 使 它们 不 能 再 存储 在 磁盘 的 当前 位 置 。 大 多 数 的 产品 都 允许 
DBA 和 修改 表 结构 ， 在 新 列 中 牌 空 值 ， 而 不 须 将 表 的 所 有 行 移 到 新 的 磁盘 位 置 ， 对 比较 大 的 表 
来 说 ， 这 项 工作 将 丘 用 巨大 的 计算 机 资源 。 不 同 的 数据 库 产 品 在 处 理 物 理 人 存储 的 问题 上 有 不 
同 的 方法 。 

5. 非 过 程 性 和 过 程 性 完整 性 约束 ; 触发 器 

SQL 完 整 性 子 蚀 的 设计 者 显然 应 尽 其 预见 在 逻辑 数据 库 设计 中 可 能 用 到 的 所 有 重要 规则 ， 
这 样 ， 这 些 规则 就 能 作为 非 过 程 性 约束 实现 。 该 约束 是 不 能 被 打破 的 ， 国 为 在 执行 SQL 更 新 
语 多 的 过 程 中 它们 始终 是 有 效 的 ， 这样 能 防止 鲁 误 的 更 新 破 环 数据 的 完整 性 - 在 本 节 的 具 余 
部 分 ， 我 们 将 对 完整 性 约束 的 各 种 方面 进行 讨论 ， 并 一 种 叫做 触发 器 的 生成 动态 规则 的 这 
程 性 方法 做 比 较 。 如 我 们 在 3.11 节 中 对 非 过 程 性 SQL 命令 的 讨论 ， 非 过 程 忻 约束 比 过 程 性 约束 
的 动能 少 很 多 ， 人 了 但 这 有 一 个 表达 复杂 性 的 问题 ， 如 果 我 们 要 加 上 这 些 功 能 ， 就 需要 人 秆 出 代价 。 
我 们 先 简 单 介 绍 一 下 和 触发 器 是 怎样 实现 的 ， 这 样 才能 知道 如 何 根据 其 利 刺 进行 选择 。 

(1) 过 程 性 约束 和 甬 发 大 

相对 有 效 的 甬 发 过 程 在 SYBASE 商 用 数据 库 产 品 中 早 就 着 在 ,现在 ORACLE、DB2 UDB.、 
INFORMIX 和 MICROSOFT SQL SERVER 中 也 都 有 。SQlI-92 中 没有 坦 供 有 关 舱 发 器 的 标准 ， 
Melton 和 Simon 写 到 “标准 委员 会 的 猜想 错误 : 他 们 没有 意识 到 多 发 器 的 需求 和 实现 的 发 展 
会 如 此 迅速 …… 但 大 多 数 销售 商 直 接 越过 SQL-92 标 准 ， 将 SQL-99 中 触发 器 的 规范 作为 实现 的 
基础 "。 我 们 将 学 习 Full SQL-99 中 的 Create Trigger 语 法 ， 如 图 7-10 所 小。 

CREATE TRIGGER trigger_name {BEFORE | AFTERY 
{INSERT | DELETE | UPDATE [OF columnname 1, columnname, ..}]! 
DN tabliename [REFERENCING corr _ name _ def {, cerr name def.,.}] 


[FOR EACH ROW | FOR EACH STATEMENT] 


LWHHEN Csearth condition)] 
{statement -- action {single statement) 


| BEGIN AfOMIC statement; | statement;...| END -- action fmultiple statements?) 


污 兴 相关 他 的 Corr_name_def 如 下 ， 
{OLD [ROW] LAS] old row corr name 
NEW LROW] [AS] néew_ row_corr_ Name 
QED TABLE [ASY oq_table_ corr_name 
NEW TABLE [AS] new table corr.namel} 





图 7-10 高 级 SQL 的 Create Trigger 刘 法 


Create Triggeri 各 名 创建 一 个 种 为 trigger_name 的 和 触发 絮 数 据 库 对 策 ， 这 个 溃 字 用 在 锯 溪 信 
息 和 以 后 从 数据 库 中 删除 该 触发 器 的 请 求 中 : 


DROP TRIGGER trigger_name: 


触发 器 在 指定 表 上 发 生 所 列 事件 【INSERT、DELETE 或 UPDATE ， 可 任意 限制 在 一 组 命 
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了 名 的 列 上 ) 之 前 (BEFORE ) 或 之 后 (AFTER ) 被 触发 { 执行 )。， 如 果 触 发 器 被 触发 ， 将 执 
行 可 选 的 搜索 条 件 《 如 果 有 的 话 )， 以 决定 当前 受 影响 的 一 行 或 多 行 是 否 引 起 讲 一 步 的 动作 。 
如 果 是 ， 被 触发 的 动作 ， 即 BEGIN ATOMIC 和 END 中 包 会 的 一 个 或 多 个 语句 将 锌 执行。 这些 
诸 句 一 般 是 以 分 号 结尾 的 可 执行 的 SQL 语句 【打开 连接 或 开始 一 个 会 话 或 事务 的 语句 是 不 多 
许 的 )， 和 包括 SQL-99 中 用 来 调用 SQL 子 程 序 的 CALL 语 句 ， 如 内 部 存储 着 的 过 程 (在 SQL-99 过 
程 件 SQL 语言 SQLAPSM， 或 产 硬 和 白 定 多 的 过 程 性 语言 中 ) 或 C、jJava 语 言 的 一 个 困 数 。 动 作 的 
粒度 是 FOR EACH ROW 或 FOR EACH STATEMENT { 缺 省 的 选项 )， 这 决定 了 动作 执行 的 频 
度 一 一 对 每 个 受 影响 的 行 热 行 一 次 或 是 在 诸 旬 结束 时 执行 一 次 。( 显然 ， 我 们 可 能 执行 多 行 的 
Update 、Delete 或 Insert 堵 可 ， 在 此 将 产 牛 很 天 的 不 同 。) 

在 被 触发 的 UPPATE 峙 件 中 ， 动 作 程序 中 的 语句 序列 可 能 在 惠 新 一 行 之 前 或 之 后 ， 使 用 
该 行 的 值 。 为 达到 这 个 目的 ,我们 可 以 用 REFERENCING 子 名 为 被 更 新 的 一 行 或 多 行 、 甚 至 
整个 表 定 兴 “相关 名 ”， 表 的 相关 名 【eold_table_corr name 或 new_table_corr_name ) 在 两 种 粒 
度 下 都 可 以 使 用 ， 而 行 的 相关 名 【old_row_corr_name 或 new_rpw_eorr_name ) 只 能 用 在 FOR 
EACH ROW 的 粒度 中 。 行 的 相关 名 可 用 于 WHEN 子 句 或 触发 器 动作 语句 ， 限 定 其 表达 式 中 的 
列 和 名， 还 可 以 用 于 确定 列 的 倩 到 底 是 来 自 旧 行 【在 更 新 之 前 ) 还 是 新 行 (在 更 新 之 后 )。 整个 
表 的 相关 名 像 表 名 一 样 使 用 ， 类 似 地 ， 用 于 确定 所 指 的 是 哪个 版 本 。 

国 为 触发 器 能 引起 一 个 动作 的 执行 ， 所 以 它 可 以 用 米 实 现 过 程 性 约束 。DBA 可 以 写 一 些 
语句 作为 实现 约束 的 过 程 性 动作 比较 普遍 的 是 用 - 些 相 对 简单 的 过 程 )。 大 部 分 主要 的 数据 
库 产品 ， 如 SYBASE、ORACLE 和 INFORMIX 都 提供 包含 常 驻 内 存 的 空 量 、 循 环 控 制 和 if- 
then-else 运 辑 的 过 程 性 SQL 语 言 的 扩展 。 在 第 4 章 中 ， 我们 简单 介绍 过 ORACLE (PL/SQL}) 和 
INFORMIX (SPL ) 的 过 程 性 语言 。DB2 UDB 的 过 程 性 扩展 少 一 些 ， 而 有 旦 只 提供 给 触 上 器 。 
比较 复杂 的 过 程 性 动作 都 是 用 如 C 等 语言 实现 ， 通 过 触发 器 调用 的 。 

因为 在 定义 触发 右 动 作 时 ， 各 产品 用 自己 特定 的 过 程 性 语 育 ， 所 以 想 给 出 一 个 Create 
Triggerf 的 “基本 SQL” 版 本 是 不 可 能 的 。 介 不同 产品 的 Create Trigger 形 式 中 ， 非 动作 部 分 很 
相位 ， 都 要 能 够 自 接地 将 简单 应 用 和 触发 北 从 -… 个 产品 移植 到 另 一 个 产品 .《 有些 应 腹 程 序 要 出 
到 产品 特定 的 时 序 规 则 ， 村 由 一 个 更 新 事件 同时 触发 多 个 触发 器 ， 这 样 的 程序 较 难 移植 。) 


CREATE TRIBBER trigger_name INO CASCADE BEFORE | AFTER)} 
{INSERT | DELETE | UPDATE [OF columnname [{， colummnname,..})) 
ON tablename CREFERENCING corr_name_def {, corr_name_def...}] 
{FOR EACH ROW | FOR EACH STATEMENT} MODE DB2S$OL 
EHHEN {search_conditionr}] 


{ statement 
| BEGIYN ATOMIC statement:; {statement:...} 上 MD 


证 法 表 或 行 的 相 光 省 字 的 cor_name der 如 下 : 
下 DOLD [AS] wld row_ COrP nafme 
[NEW 【AS new_row corr_name 
| OLD_TABLE [CAS] old_ table_corr. name 
| NEW_TABLE [AS] new table_ corr_namel 





图 7-11] DB2 UDB 的 Create Triggeri 语 法 


图 7-11 是 DB2 UDB 的 Create Trigger 语 法 。 它 与 SQL-99 的 语法 在 一 些 次 要 的 方面 咯 朋 不 问 。 


第 7 便 完 融 性 、 视 轩 、 安 会 纤 和 月 录 309 


首先 ，DB2 UDB 不 直 要 在 BEFORE 和 触发 器 中 加 上 关键 字 NO CASCADB 来 保证 它 不 会 触发 其 他 
触发 器 。 其 次 ， 附 加 的 关键 字 MODE DB2SQL 必 须 出 现 ， 这 样 以 后 DB2 UDB 就 能 够 提供 一 个 
新 的 MODE 关 键 字 来 定义 新 的 功能 ， 而 不 破坏 现 有 代 公 ,最 后 ， 可 选择 的 REFERENCES 子 僻 
中 的 :关键 子 与 SQL-99 有 些 不 同 ， 必 须 特 别 指定 FOR EACH 子 名 中 的 一 个 ( 不 能 使 用 缺 省 值 )， 
DB2 UDB 仅 对 AFTER 和 触发 器 支持 FOR EACH STATEMENT。 一 般 而 言 ，FOR EACH ROW 触 
发 右 的 实现 比 FOR EACH STATEMENT 更 普遍 
ORACLE 的 Create Tiigger 语 法 如 图 7-12 所 示 .， 它 与 SQL-99 的 一 个 很 大 的 不 同 是 ， 它 的 触 
发 回 语句 完全 是 用 PL/SQL 描 述 的 《可 能 包括 CALL 语 句 ， 泗 用 已 经 存储 了 的 过 程 或 一 些 语 吝 
(如 C) 的 函数 。) 
CREATE [OR REPLACE] TRIGGER trigger_name lBEFORE | 点 FTER | INSTEAD QF} 

{INSERT | DELETE | UPDATE [OF columnname {, columnname...111 

ON tablename CREFERENCING coerr_name_def {, corr name def...}] 

[FOR EACH ROW | FOR EACH STATEMENT} 


[WHEN tseareh. condition}) 
BEGIN statement {statement;..,.} END: 


定 必 行 胸 相关 避 字 的 cor_nanme_def 如 下 : 


{0LD old_ row_ corr_name 





[NEW new_row_corr_name} 


网 7-12 ORACLE 的 Create Triggeri 语 法 


重要 注意 事项 在 ORACLE 中 ， 可 选 的 WHEN 搜索 亲人 忻 不 能 包含 任何 子 查询 或 调用 用 户 
定 六 的 函数 ; 但 是 ， 这 样 的 条 件 代码 可 以 在 甬 发 器 体内 实现 ， 


INSTEAD OF 子 句 将 触发 触发 器 ， 但 不 执行 INSERT、UPDATE 或 DELETE 等 动作 。 人 而 且 ， 
因为 沾 存 在 old_table_corr_name， 所 以 在 - -个 AFTER 和 触发 器 中 ， 我 们 无 法 访问 整个 旧 表 ， 只 能 
用 止 贡 的 名 字 访 问 新 表 (但 并 小 总 是 这 样 ， 参见 《ORACLE8 Server Application Developer’s 
Guide 》(《ORACLE8 服 务 应 用 程序 开发 指南 》), 本 章 最 后 的 “推荐 读物 ”[14] }。 

下 面 我 们 将 使 用 ORACLE 触 发 器 语句 的 语法 ， 并 简要 说 明 等 价 的 DB2 UDB 形 式 。 我 们 先 
用 触发 侨 实 现 几 个 原来 用 Create Table 语 可 实现 的 完整 性 约束 来 研究 触发 器 的 特性 。 


例 7.1.5 使 用 触发 器 来 检查 ， 新 的 customers 行 中 值 不 超过]5.0 的 discnt， 


create trigger discnt max sfter insert on customers 
referencing New 35 Xx 
for each row When (x.discht > 15.07 
begin 
raise_application errort-20003, ‘tnvalfd disceunt attempted on Tnsert"): 
End : 


每 进行 一 次 表 customers 的 插入 ， 这 个 和 触发 器 就 会 测试 WHEN 子 名 中 的 搜索 条 件 
discnt>15.0， 看 它 是 否 对 每 一 行者 满足 。 如 果 发 现 有 不 满足 的 悄 况 ,触发 器 将 执行 
RAISE_APPLICATION_ERROR 语 名， 撤回 甬 发 融 的 所 有 人 作用， 执行 该 插入 命令 的 应用 程序 
中 将 出 现 SQLERROR 情 况 ， 新 插入 的 行 部 被 删除 ，SQLCODE 返 回 - 20003，SQLSTATE 轩 为 
72000， 表 示 SQL 执 行 出 错 。 如 时 应 用 程序 是 用 PL/SQL 写 的 ， 可 妨 为 特定 的 应 用 程序 错误 
(这 里 是 - 20003 ) 命名 ， 像 正常 命名 的 例外 一 样 处 理 。 
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在 搜 行 Update 语 名 后， 触发 器 也 可 以 保证 表 customete 中 的 Gaiscnt 值 不 大 于 15.0;， 实 
际 上 ， 在 ORACLE 中 的 - -条 Create Trigger 语 可 可 以 处 理 丙 个 事件 ， 只 要 把 AFTER 子 句 的 第 一 
行 奉 换 为 

.rafter irnsert or Update... 国 

例 7.1.5 中 ， 触 发 器 动作 中 只 有 一 个 语句 ，ORACLE 的 语句 形式 : 


RAISE APPLICATION_ERRORierrer_number, error MeEssage string}: 


其 中 的 error_number 必 须 在 - 20000 到 - 20999 之 间 ，- 20000 表 未 非特 定 的 庶 用 程序 错误 ，- 
20001 到 - 20009 表 示 程 序 员 冠 义 的 特 完 的 应 用 程 夯 错误 。 执 行 这 杂 语 后 会 时 致 触发 器 的 应 用 程 
序 中 出 现 SQLERROR 情 上 总， SQLCODE 变 基 允 许 用 户 自 定 交 错误 码 ， 而 SQLSTATE 有 具有 一 个 通 
用 的 值 7?2000 表 示 SQL 执 行 出 错 。 注意 ，SQL-99 不 提供 类 似 RAISE_APPLICATION_ERRORIt ) 
的 产生 例外 语句 ， 可 以 用 三 商 特定 的 SQLCOPE 变 旺 定 六 用 户 的 例外 号 、 另 一 方面 ， 
SQLSTATE 的 部 分 空间 是 为 实现 时 定义 的 代码 保留 的 ， 所 以 厂商 采用 这 种 机 制 也 是 合适 的 ， 如 
DB2 UDB 中 所 用 的 。ORACLE 的 库 晒 数 sqlglmt ) 得 到 【用 附录 中 中 的 print_dberror ) 亲 数 打印 ) 
包 信 用户 定 艾 的 销 误 信息 error_message_string 的 错误 信息 串 ， 作 为 
RAISE_APPLICATION_ERROR( ) 的 第 二 个 参数 ， 还 有 诸如 宜 和 触发 的 甬 发 器 名 等 其 他 信息 ( 如 
果 应 用 程序 是 用 PLASQL 写 的 ， 可 以 为 特定 的 应 用 笠 序 错误 环境 命名 ， 像 正常 伍 名 的 例外 一 样 
处 理 。} 

DB2 UDB 中 ， 相 庶 的 触发 船 语 和 铝 如 下 : 

SIGNAL SOLSTATE string (CSOLCA error message, string):; 
如 时 用 DB2 UDB 来 实现 例 7.1.5， 民 友 如 下 : 


create trigger discnt_max after insert on customers 
referencing NeNW as KR 
for each row when {x.disent > 15.0) 
STONAL *70003* ("invalid dfscount attempted on insert); -- DBz UDB STATEMENT 


这 条 语句 将 导致 语句 在 执行 过 程 中 异常 终止 ， 错 误 码 是 一 个 5 个 字符 的 SQLSTATE_string， 旭 | 
例 7.1.5 中 的 70003。 括 号 中 的 SQLCA_error_ Imessage_string ，'ipvalid discount attempted on 
insert ， 放 在 SQLCA 的 SQLERRMC 字 段 中 ,可 以 用 附录 B 的 print_dberror( ) 困 数 打 印 出 米 【 从 
嵌入 的 C 程 序 中 ) 想 了 解 关于 SQLSTATE 租 的 更 多 信息 ， 请 参阅 5.2 节 中 的 “ 品 式 的 错误 检测 ” 
小 节 。 根 据 上 商 的 习惯 ， 所 有 以 “?” 开 头 的 SQLSTATE 码 被 留 作 特殊 用 途 (这 与 SQL-99 标 准 
是 一 致 的 ，SQL-99 标 准 中 所 有 以 数 宁 5 到 9 或 字母 1 到 ZZ 开头 的 代码 是 在 实现 时 定义 的 )。 

为 了 得 到 一 个 能 实现 简单 的 FOREIGN KEY 和 REFERENCES 子 句 的 触发 器 ， 触 发 器 还 需 
要 涉及 一 张 表 。 

例 7.1.6 ”下 面 是 如 何在 X/Open 和 Full SQL-99 标 准 中 实现 叫做 ON DELETE SET NULL 的 
策略 ,但 ORACLE 中 只 有 ON DELETE 选 项 ， 没 有 ON DELETE SET NULL 选 项 。 将 这 项 策略 
用 于 表 customers 和 orders， 删除 表 customers 的 一 行 时 ， 我 们 把 orders 中 对 ciqd 的 引 
用 都 置 为 空 值 ， 否 则 它们 将 成 为 非 空 的 非法 伪 。 


create trigger foreigrneid after delete on customers 
referancing Old as Ocust 
for each row 
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begin 
Update orders set cid = nyull Where cid = :oOcust.cid: 


end:; 

注意 ， 在 DB2 UDB 中 我 们 不 过 要 这 个 触发 器 ， 因 为 它 已 经 有 ON DELETE SET NULL 选 
项 了 。 上 述 的 触发 融 与 BEFORE 和 触发 偶 一 样 工作 ,但 根据 ORACLE 的 说 法 ， 总 体 来 说 AFTER 
触发 器 运行 起 米 更 快 。 四 

要 过 程 性 地 实现 CASCADE 策 略 是 相当 困难 的 (但 在 ORACLE 和 DB2 UDB 中 用 ON 
DELETE 子 句 可 以 实现 )， 出 于 这 个 原因 和 我 们 将 简单 讨论 的 其 他 原因 ，S$QL-99 委 员 会 决定 ， 
尽管 加 入 了 实现 过 程 性 能 力 ， 仍 推荐 使 用 非 过 程 性 动作 ( 约束 )。 

(2) 过 程 性 与 非 过 程 性 约束 的 优 缺 点 

我 们 考 虚 的 所 有 约束 都 是 为 了 防止 错误 的 SQL 更 新 语句 意外 地 破坏 数据 完整 性 。 这 表明 
很 多 错误 是 由 十 用 户 鸣 扰 大 意 地 进行 SQL 贞 新 而 产生 ， 完 整 性 约束 概念 的 出 现 ， 就 是 因为 在 
一 段 时 间 内 ， 这 样 粗 心 的 用 户 很 多。 现今 多 数 计 算 机 专业 人 士 都 认为 不 应 允许 粗心 的 用 户 对 
重要 的 表 进 行 交 互 式 的 更 新 。 粗 心 的 用 户 很 容易 错误 地 把 一 些 行 中 某 几 放 的 值 改 成 看 似 正 硝 
(满足 所 有 能 想到 的 约束 ) 实际 上 完全 错误 的 值 。 只 人 允许 用 户 通 过 一 个 程序 界面 来 更 新 表 会 比 
较 好 ， 因 为 程序 经 过 仔细 的 设计 ， 不 太 可 能 出 现 错 误 。 如 果 是 这 样 ， 为 什么 我 们 不 去 掉 有 即席 
SQL 中 的 前 新 语句 ， 用 程序 抽 辑 来 实现 约束 呢 ? 这 种 逻辑 灵活 性 很 大 ， 而 且 理 想 情 况 下 可 以 
实现 DBA 规 要 的 所 有 完整 性 约束 。 

它 的 危险 之 处 在 于 它 过 于 灵活 。 一 个 对 规则 不 是 很 清楚 的 新 程序 员 ， 甚 至 是 一 个 有 经 验 
的 程序 员 ， 稍 有 踊 忽 就 可 能 破坏 程序 要 维护 的 规则 。 为 避免 这 种 情况 ， 有 必要 建立 一 个 程序 
技 ， 所 有 的 数据 库 更 新 操作 在 这 一 层 上 进行 ,这样 就 可 以 减少 甚至 避免 上 述 错误 ， 也 就 是 说 ， 
更 新 表 时 ， 应 用 程序 员 不 能 直接 用 般 人 式 SQL 语 可 ， 必 须 调 用 层 柳 数 update_tblnamel )。 但 是 
要 提供 一 个 既 能 很 好 地 保证 完整 性 又 灵活 高 效 的 程序 层 并 不 是 一 个 简单 的 设计 任务 。 最 初 ， 
触发 器 特征 就 是 用 过 程 性 形式 完成 同样 的 功能 ， 对 程序 员 来 说 ， 这 些 都 是 透明 的 。 

显然 ，Create Table 语 句 中 的 非 过 程 性 约束 的 种 类 是 有 限 的 (CHECK 约 率 、UNIQUE 值 约 
束 、 引 用 外 键 FOREIGN KEY-REFERENCES 约 束 等 )， 这 限制 了 它 的 能 力 ， 但 也 使 它 比 可 任 
意 改变 的 、 复 杂 的 过 程 性 约束 更 容易 理解 。 我 们 使 用 的 有 限 的 非 过 程 性 约束 集 可 以 像 系统 日 
录 表 中 的 数据 值 那样 排列 ， 系 统 目 录 表 是 系统 支持 的 表 集 , 列 出 数据 库 中 定 你 了 的 所 有 对 得 
{ 将 在 本 章 的 后 面 介 绍 )， 而 且 约 束 可 以 根据 有 DBA 权 限 的 用 户 的 要 求 进 行 缩 茂 或 更 新 。 这 是 
.个 值得 考虑 的 重要 因素 。 系 统 所 有 的 规则 自动 集中 在 一 个 地 方 ， 用 易于 理解 的 类 似 于 存储 
数据 的 方法 存储 ， 便 于 DBA 将 它们 作为 一 个 整体 进行 检查 。 

非 过 程 性 完整 性 约束 优 于 过 程 性 触发 器 的 另 一 个 理由 是 ， 非 过 程 性 约束 直接 为 系统 所 知 ， 
因此 检查 起 来 比 过 程 性 的 逻辑 要 有 效 得 多。 多 数 情况 下 如 此 ,但 并 不 总 是 如 此 。 为 了 实现 同 
等 的 约束 ， 系 统 经 常 做 的 工作 和 使 用 过 程 性 摧 辑 实现 可 兼容 的 约束 差不多 ， 因 此 使 用 一 个 容 
易 控 制 的 系统 ， 并 不 意味 着 能 大 幅度 地 提高 性 能 。 

驶 斥 非 过 程 性 系统 约束 的 一 个 理由 是 ,过程 性 约束 的 作用 更 大 。 在 下 面 的 两 个 领域 中 ， 
非 过 程 性 约束 目前 还 显得 有 所 欠缺。 

给 出 约束 不 满足 时 的 相应 动作 “” 非 过 程 性 约 昌 的 一 个 主要 缺点 是 ,它们 是 事先 实现 的 ， 
因此 无 法 知道 当 约 东 不 满足 时 ， 程 序 应 该 做 些 什 么 。 在 一 个 管理 员工 的 数据 库 中 ， 我 们 可 能 
希望 创建 一 个 完整 性 约束 ， 保 证 所 有 员工 的 年 苍 在 18 到 70 岁 之 间 。 如 果 有 一 个 自动 例 程 将 一 


312 并 所 此 原理 、 疾 恕 性 糙 训 





个 员工 的 年 龄 改 为 ?1， 除 了 指出 更 新 失败 外 ， 我 们 肯定 还 需要 做 一 些 别 的 动作 一 一 不 布 望 该 
员工 继续 在 公司 工作 ， 将 其 年 龄 值 保 持 为 ?0， 尽 管 实际 年 龄 已 经 增加 了 。 尽 管 约束 能 自动 地 
拒绝 错误 的 更 新 ， 针 对 该 情况 应 执行 什么 动作 却 必 须 由 应 用 程序 员 提 供 。 这 种 拒绝 是 以 带 有 
某 个 错误 码 的 SQL 例外 的 形式 出 现 的 ， 在 触发 句 中 ， 应 用 程序 对 每 个 例外 都 要 检测 一 次 错误 
码 ， 而 不 是 对 所 有 例外 只 检测 一 次 。 

再 举 一 个 例子 , 我 们 可 能 需要 一 条 规则 ,只 接受 来 自 订货 员 的 合法 的 名 字 和 地 址 一 一 例如 ， 
须 保证 邮编 与 州 对 应 。( 邮编 不 能 跨 州 一 这 条 约束 可 以 用 参照 完整 性 实现 。) 如 果 检 查 不 遂 
过 ， 我 们 不 希望 只 是 简单 地 拒 收 数据 。 可 能 需要 请 用 一 个 程序 ， 要 求 订货 员 重 新 输入 信息 ， 
而 且 如 果 错 误 重 复出 现 ， 上 应 先 将 它 暂 时 储存 下 来 ， 可 以 存在 一 张 单独 的 表 中 。 毕 竟 ， 不 完全 
正确 的 数据 对 一 个 企业 也 是 有 价值 的 ， 通 过 耸 析 可 以 纠正 错误 。 在 这 两 个 例子 小， 为 非 过 程 
性 约束 指定 的 测试 是 这 项 工作 中 最 简单 的 部 分 ， 难 的 是 指定 当 测 试 不 通过 时 应 来 取 的 动作 ， 
显然 ， 这 就 需 区 一 个 过 程 性 方法 耳 。 

保证 事务 的 一 致 性 另 一 个 重要 的 约束 是 事务 的 一 致 性 ， 用 来 保证 更 新 事务 的 正确 性 。 例 
如 ， 在 商业 事务 中 ， 把 钱 从 一 个 账户 转 到 另 一 个 账户 ， 必 须要 有 一 致 性 规则 保证 钱 既 不 会 多 
出 来 ， 也 不 会 少 掉 。 只 要 程序 逻辑 本 身 保 证 了 这 条 规则 ， 这 可 以 由 并 发 的 程序 保证 .但 程序 
逻辑 中 肯定 会 有 问题 ， 而 约束 可 以 在 运行 时 检测 到 非常 细小 和 的、 破坏 一 至 性 的 错误 ， 这 对 那 
些 需 要 对 更 新 事务 村 作 负 袜 的 应 用 程序 管理 员 来 说 可 谓 是 一 大 福音 。 但 是 ， 大 多 数 商 用 数据 
库 都 不 提供 在 事务 结束 前 用 于 处 理 两 个 或 多 个 更 新 操作 之 间 交 互 作用 的 约束 。 

使 用 触发 器 ， 我 们 可 以 检查 多 个 更 新 的 作用 ， 或 使 一 个 更 新 操作 在 另 一 个 执行 之 后 自动 
发 生 。 例 如 ， 假 定 对 表 orders 中 的 每 一 个 订单 ， 需 要 统计 与 该 订单 有 关 的 表 line_items 
中 行 的 个 数 。 我 们 可 以 用 一 个 触发 器 ， 当 line_item 揪 人 时 触发 ， 将 表 crders 相 应 行 上 的 
记 数 值 加 1。 这 样 计数 工作 可 由 和 触发 器 完成 ， 而 不 需要 靠 应 用 程序 逻辑 来 实现 。 

例 ?.1.7 下 面 使 用 触发 器 为 每 个 订单 实现 1ine_item 记 数 。 假 定 订 单 已 存在 ， 且 
n_items 值 初始 化 汶 0。 

create trigger incordernitems after insert on lineitems 


Feferencfng old row as oldii 


for each row 


begin -for ORACLE, leave Out for DBe UnB 
update orders set n_items = Nn_items + 1 Where ordno = :01dii,.ordno;: 
end: "- for ORACLE 


create trigger decordernitems after delete on lineitems 
referencing old Po as oldii 
for each row 
beygin 
update orders set rn Ttems = N_items - 1 Where ordno = :01dli.ordno; 


end: 
图 
上 再 举 一 个 例子 ,假定 两 个 账户 是 连 在 一 起 的 ， 为 保证 余额 为 正 ， 一 个 可 以 辣 另 一 个 值钱 。 
当 异 这 个 动作 会 引起 大 范围 的 程序 动作 时 ,我 们 可 以 用 一 个 触发 器 来 实现 它 。 如 果 第 二 个 帐 
户 的 资金 也 不 足 ， 则 产生 一 个 例外 。 
因为 在 事务 逻辑 中 不 具有 指定 替代 动作 及 测试 一 致 性 规则 的 约 东 能 力 ， 我 们 很 自然 地 会 
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提出 以 下 问题 : 如 果 让 程序 员 保 证 程序 中 复杂 的 规则 ， 并 在 程序 逻辑 中 单独 处 理 各 个 蔡 代 动 
作 ， 为 什么 还 要 对 每 种 情况 单独 给 出 一 个 约束 呢 ? 原因 可 能 是 ， 我 们 想 尽 量 限制 能 预料 到 的 
销 误 ， 和 希望 以 此 提高 数据 库 应 用 程序 的 可 靠 性 。 

过 程 性 约束 的 一 个 主要 优点 是 便于 实现 一 些 新 想法 。 尽 管 一 个 商用 产品 最 后 可 能 在 系统 
中 加 入 某 个 有 特定 作用 的 约束 ， 但 用 户 通常 要 等 很 长 时 间 才 能 等 到 它 在 下 个 版 本 中 实现 ， 
在 长 达 几 年 的 时 间 里 ， 很 多 数据 库 销 售 商都 不 提供 参照 完整 性 ， 直 到 它 被 证 明 有 很 多 好 处 。 
约束 的 规格 说 明 还 处 于 发 展 阶段 ， 本 章 提 出 的 很 多 问题 可 能 要 等 到 更 统 -- 的 系统 出 现 后 才能 
解答 。 也 许 在 将 来 的 数据 库 系 统 中 ， 提 供给 DBA 的 约束 中 。 一 - 些 是 非常 普通 的 非 过 程 性 约束 ， 
一 些 古 用 来 处 理 复 淋 情况 的 过 程 性 约束 。 

(3) 列 出 己 和 定义 的 触发 器 

列 出 所 有 已 定义 的 触发 器 的 标准 方法 是 用 Select 语 句 从 系统 目录 表 中 检索 触发 器 名 ， 系 统 
月 录 表 是 系统 文 持 的 表 集 ， 列 出 数据 库 中 定义 了 的 所 有 对 象 (将 在 本 章 后 面 介绍 )。 不 同 数据 
库 产 品 的 系统 日 录 表 的 名 字 和 结构 也 不 同 。 在 ORACLE 中 ， 要 找到 甬 发 器 和 应 用 它们 的 表 ， 
应 使 用 下 询 语 句 : 


select trigger name, table_name from user_ trigyers: 


如 采 时 得 到 某 个 特定 触发 器 的 信息 ， 需 要 用 大 写字 母 的 名 字 引 用 它 : 


select when_ clause,. trigger_body from user_triggers 
where trigger_name = “DISCHT MAW®; 


如 果 查 询 结 果 的 显示 被 截断 了 ， 用 户 可 以 用 SQLs*Plus 命 令 重新 设置 这 类 字段 的 最 示 的 长 
度 ， 缺 省 值 为 80， 例 如 : 


set long 1000 


在 DB2 UDB 中 ， 要 列 出 用 户 eoneil 的 触发 占 ， 我 们 应 该 写 以 下 诸 句 : 


select trigname, tabname, text from syscat.triggers where definer ~ ‘EONEIL’; 


7.2 建立 视图 


下 文中 ， 我 们 将 把 用 Create Table 语 句 定义 的 表 称 为 基本 表 。 基 本 表 中 的 行 实际 上 是 存储 
在 磁盘 上 的 ， 通 常 是 以 物理 记录 的 形式 ， 不 同 数据 类 型 的 字段 连续 存放 ， 如 Create Table 语 句 
中 指出 的 那样 。 现 在 关系 模型 的 一 个 重要 属性 是 ， 由 SQL 的 Select 语 句 得 到 的 数据 仍然 以 表 形 
式 出 现 ， 由 此 引出 了 视图 表 的 定义 。 视 图 表 (有 时 简称 为 视图 ) 是 一 个 由 子 查询 产生 的 表 ， 
但 它 可 以 有 自己 的 名 字 ， 在 很 多 方面 都 类 似 于 基本 束 。 视 图 表 是 一 个 从 数据 库 的 基本 表 中 选 
取出 来 的 数据 组 成 的 外 辑 窗 ， 基 本 表 的 名 字 用 Select 语 句 的 FROM 子 名 指定 ， 在 经 过 并 慎 的 限 
制 后 ， 它 甚至 可 以 是 可 以 更 新 的 。 

例 7.2.1 创建 一 个 叫 agentorders 的 视图 表 ， 它 扩 氏 了 表 orders 的 行 ， 以 包 会 订货 
的 代理 商 的 所 有 信息 。 用 SQL 的 Create View 语 人 名 实现 : 

create view agentorders (ordno, month, cid, aid, pid, qty, charge. aname, acity, percent} 

as select ao.ordno, o.month, o.cid, p.aid, o.pid, 0.9ty. 0o.dollars, 


.aname,. a.city. a.percent 
from orders vo, agents a where o.aid = a,.61d; 
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注意 到 我 们 将 检索 出 的 o ,dollars 列 重 命名 为 charge。 除 o. aid 外 ，Select 的 目标 列表 
中 的 所 有 列 的 名 字 对 于 它们 的 包 售 表 是 唯一 的 ， 国 此 不 要 求 在 目标 列表 中 再 进行 限定 : 


0.0rdno, a.city 等 , 国 


执行 Create View 语 名 时， 没有 数据 被 检索 或 存储 。 但 是 ,视图 的 定义 应 该 作为 数据 库 中 
一 个 独立 的 对 象 存 改 在 系统 日 录 中 ， 以 备 其 他 的 查询 或 Update 语 句 的 FROM 子 句 中 以 这 一 视 
疼 的 名 宁 对 其 进行 检索 。 记 得 图 3-11 的 高 级 SQL 语 法 允许 Select 语 句 的 FROM 子 句 中 包含 子 杏 
询 ， 这 里 看 来 ， 视 图 正 是 给 子 查 询 一 个 名 字 。 视 图 表 的 概念 尽 已 被 标准 化 了 ， 因 此 大 部 分 数 
据 库 产品 都 支持 视图 ， 而 图 3-11 的 高 级 SQL 语法 就 不 是 普遍 支持 的 。 对 数据 库 系 统 来 说 ， 修 
改 视图 的 查询 或 Update 语 名 是 很 容易 的 一 视图 的 定义 与 这 些 语句 的 内 容 有 紧密 联系 一 一 因此 
修改 的 查询 或 更 新 实际 上 完成 对 基本 表 上 的 访问 。 这 种 方法 称 为 查询 修 政 。 

和 例 7.2.2 用 例 ?.2,1 中 的 agentorgders 视 图 计算 Toledo 的 代理 向 的 订单 金额 总 数 。 下 面 是 
用 户 应 该 给 出 的 查询 : 

select sumicharge} from agentorders Where acity = ‘Toledo': 

数据 库 〔 至 少 是 概念 上 地 ) 对 这 一 查询 进行 修改 来 考虑 例 7.2.1 中 视图 agentorders 的 
定义 ,得 到 的 查询 如 下 (被 替代 的 视图 中 定义 的 元 案 用 下 划 线 标 出 ): 


select sumio.dollars) from orders D, agents a 
where 0.aid = a.aid and a.city = Toledoa'; 





认识 到 视图 内 是 基本 表 数 据 的 一 个 窗 ， 这 是 非常 重要 的 。 创 建 视图 时 ， 我 们 得 到 的 并 不 
是 数据 的 快照 ， 面 只 是 存储 一 些 定义 ， 每 执行 一 个 新 的 查询 都 必须 重新 解释 这 些 定义 ;， 所 以 
作用 于 视图 的 查询 能 及 时 地 反映 基本 表 中 数据 的 安 化 。 

本 文中 用 到 的 基本 SQL 标准 的 Create View 语 句 的 完整 叙述 如 图 7-13 所 示 。( 它 与 X/Open 
和 Core SQL-99 标 准 是 相同 的 。) 


CREATE YIEW viewname [{columnname {, columnname...}}] 


AS subquery [WITH CHECK OPTIQN]: 





图 7-13 基本 SQL 的 Create View 语 法 


记得 图 3-13 中 定义 的 子 查询 只 比 完整 的 Select 语 句 少 一 个 DRDER BY 子 铅 ， 对 视图 的 定义 
基本 没有 限制 。Create View 命 令 可 被 用 作 腻 人 人 式 SQL 语 句 ， 但 视图 的 子 查 询 中 不 能 包含 宿主 变 
量 或 动态 参数 。 创 建 视图 的 用 户 即 是 视图 的 所 有 者 ， 有 更 新 视图 的 权限 ， 前 提 是 视图 是 可 更 新 
的 (解释 网 下 )， 量 且 该 用 户 对 定义 视图 的 基本 表 也 有 更 新 权限 (只 能 有 -个 这 样 的 基本 表 ) 

可 选 的 WITH CHECK QPTION 子 名 规定 ， 通 过 视图 完成 的 Insert 和 和 Update 操作 改变 基本 表 
的 肉 容 ， 如 果 导 致 对 视图 的 子 查询 是 不 可 见 的 行 ， 它 们 将 不 被 允许 ; 说 明 见 例 7.2.4.。 加 果 图 
7-13 中 可 选 的 列 名 列表 没有 给 出 ， 新 创建 的 视图 将 继承 子 查 询 中 日 标 列表 的 名 字 。 但 如 果 视 
图 的 列 在 且 标 列表 中 表示 表达 式 则 必须 给 出 和 名字。( ORACLE 和 DB2 UDB 人 允许 子 和 查询 的 表达 
式 用 列 的 别名 ,但 这 并 不 普遍 ， 目 前 INFORMIX 就 不 支持 这 种 用 法 。) 同时 要 注意 ， 在 通过 继 
蒜 得 到 的 视图 的 目标 列表 中 不 需要 限定 词 保 证 列 名 唯一 ， 但 如 果 目 标 人 列表 中 不 用 限定 疗 ， 如 
时 原来 的 列 名 蛋 复 ， 则 要 专门 为 视图 中 的 列 命 各。 这 一 点 在 例 7.2.3 中 阐述 。 
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例 7.2.3 创建 一 张 称 为 cacities 的 视图 ， 列 出 表 customers 和 表 agents 中 所 有 配对 
的 城市 ， 满 足 这 个 城市 的 代理 商 为 另 一 个 城市 的 顾客 下 了 一 份 订单 下面 的 语句 是 错误 的 ， 
因为 得 到 的 视图 中 两 个 city 列 的 名 字 和 相同 。 


create view Cacities das 
select ce.clty, a.c1ty * TLEEGAL YIEW OEFINITION 


from customers ce, orders d, agents t 
where t,tid = oO,.cid and dD.aTld = a.31d: 


这 样 的 语句 运行 时 会 产生 错误 。 我 们 需要 为 视图 给 出 不 同 的 ci ty 和 名: 
Create view cacities {rcity, acity} as 
seltect Cc.dity, .city 
from customers ¢, orders 0, aderts a 
where ccid = .cid and D.aid = a.aid: 


假定 有 -个 数据 库 系 统 的 Create Table 语 名 中 不 支持 CIIECK 选 项 ， 我 们 可 以 用 视图 来 克服 
这 种 限制 。 

例 7.2.4 下 面 我 们 看 看 如 何 用 视图 中 的 WITH CHECK QPTION 子 句 实现 Create Table 语 名 
中 CHECK 子 句 的 功能 ， 所 有 对 表 的 更 新 都 要 通过 视图 来 实现 。 假 定 表 customers 己 经 用 例 
7.1.2 的 方法 建立 ,但 没有 CHECK 子 名 保证 daiscnt <= 15.0。 我 们 创建 如 下 的 视 峰 ， 


treate view Custs gs select * from customers 


Where discnt ce 15.0 with check option; 

现在 ， 所 有 使 表 customers 的 discnt s15 .0 的 更 新 都 将 失败 ， 因 为 被 改变 的 行 对 视 
图 是 不 可 见 的 。 考 虑 如 下 更 新 : 

update custs set discnt = discnt + 4.0: 

根据 图 2-2 的 数据 ， 对 顾客 ec002 的 更 新 将 和 失败， 因为 aiscnt 的 值 将 变 成 16.0， 而 月 对 视 
图 是 不 可 见 的 。 如 果 对 每 一 行 的 更 新 CHECK 选 项 都 不 成 立 ， 那 么 最 后 会 报销， 而 且 表 不 会 被 
改变 。 | 

我 们 将 简要 地 说 明 ， 不 是 所 有 的 视图 都 能 接受 更 新 并 将 更 新 实施 到 基本 表 上 。 可 以 被 更 
新 的 视图 称 为 可 更 新 视图 。 注 意 ， 要 在 - -个 视图 的 基础 上 建立 男 一 个 视图 ， 册 建立 贡 套 视图 
定义 ， 是 完全 可 能 的 。 

例 7.2.5 ”创建 一 个 叫 acoxrders 的 视图 ， 给 出 所 有 订单 信息 以 及 订单 中 涉及 到 的 代理 商 
和 顾客 的 名 年; 


create view acorders iordno. month, cid, aid, pid, qty, 
dollars, arame, cname) 
as Select ao,ordno, ao.month, apo.cid, ao.3id, ao.pid, a0o.9qty, 
a0.charge, ao.aname,. C.cname 
from agentorders ao, customers & where ao.cid = c.cid: 


可 以 看 到 ， 例 7.2.1 中 的 视图 agentorders 用 在 视图 acorders 定 义 的 FROM 列 表 中 。 国 
(4) 列 出 已 定义 的 视图 


列 出 所 有 数据 库 中 定义 了 的 视图 的 标准 方法 是 用 Select 语 名 从 系统 目录 表 中 检索 视图 名 ， 
(细节 参见 7.4 节 )。 例 如 ， 根 据 X/Open 标 准 ， 要 列 出 所 有 视图 应 该 用 下 面 的 语句 : 
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select tablename from info_ schem.tables where table type = ‘YIEW': 
不 同 数据 库 产品 的 系统 目录 表 的 名 字 和 结构 也 不 同 。 在 ORACLE 中 ， 我 们 应 该 与 
telect view name rom USer _ views: 

对 每 个 这 样 的 视图 ， 我 们 可 以 用 Describe 语 句 获 得 任何 表 或 视图 ( 以 及 数据 库 中 的 其 他 对 象 ) 
的 更 进 -一步 的 信息 .例如 : 

describe agentorders: 

在 DB2 UDB 中 ， 要 列 出 用 户 eoneil 榴 视图 ， 应 该 号 

select viewname from syscat. yigws Where definer 一 "EONEIL"; 

DB2 UDB 描 述 命 令 只 能 用 于 表 ， 不 能 用 于 视图 。 但 是 ， 有 关 列 的 信息 可 以 从 
syscat.columns 中 得 到 。 参 见 本 章 7.4 节 有 关 的 系统 日 录 的 内 和 容 。 

(5) 删除 表 和 帘 图 

用 于 从 系统 目录 表 中 删除 视图 定义 的 标准 SQL 人 语句 与 删除 表 的 Drop 语 名 基本 相同 ， 删 除 
表 语 铝 的 有 些 特征 我 们 还 设 有 谈 到 。 下 面 先 介绍 XAOpen 和 Full SQL-99 中 完整 的 Drop Table 和 
Drop View 语 句 (Core SQL-99 中 没有 CASCADE 选 项 )。 


DROP {TABLE tablename |, VIEW viewname} {CASCADE|RESTRICT)}: 


这 种 形式 要 求 指定 CASCADE 或 RESTRICT， 而 大 部 分 产品 都 给 出 了 和 缺 省 值 。 在 Prop 
Table 语 名 中 ，{CASCADE | RESTRICT} 指 出 ， 如 果 FOREIGN KEY 约 束 或 视图 表 引 用 了 被 出 
除 的 表 ， 应 该 如 何 处 理 : CASCADE 表 示 所 有 的 外 键 约束 和 视图 都 问 时 被 删除 ，RESTRICT 肯 
示 在 这 种 情况 下 ，Drop Table 语 名 失败。 类 似 地 ，Drop Yiew 语 句 的 情况 下 ，CASCADE 和 
RESTRICT 指 出 ， 如 果 有 一 个 视图 是 在 这 个 即将 被 删除 的 视图 的 基础 上 建立 的 ， 该 如 和 何 处 理 、 
当 基 本 表 被 删除 时 ， 它 的 所 有 行 都 被 自动 删除 ， 但 视图 实际 上 是 虑 的， 没有 实在 的 行 存 在 ， 
因此 删除 视图 时 ， 其 实 什 么 也 设 有 被 删 掉 。 

只 有 表 或 视图 的 所 有 者 【通常 是 创建 者 ) 有 权 删 除 它们 。 许 多 产品 也 用 Drop 语 句 从 系统 日 
录 中 删除 其 他 类 型 的 数据 库 对 象 ， 如 表 空 间 、 索 引 等 。 我 们 将 在 第 8 章 中 介绍 这 些 数据 库 对 每 。 

以 ORACLE 为 例 解 释 图 7-14 的 含义 , ORACLE 中 的 写法 应 如 下 : 


DROP TABLE tablename TOASCADE CONSTRAINTS]: 
DROP VIEN viewname,; 


ORACLE 删除 一 个 表 或 视图 时 ， 基 于 它 的 视图 和 触发 器 将 变 成 无 效 的 。 如 果 再 以 相同 的 
列 和 名 重新 建立 一 个 表 ， 这 些 视 图 和 和 触发 器 可 以 再 次 变 成 有 效 的 。 在 Drop-Tabie 语 名 中 ， 
CASCADE CONSTRAINTS 子 句 要 求 所 有 引用 防 表 的 约 东 同 时 拥 删 除 。 如 条 没 有 这 个 于 句 ， 
若 任 何 约束 引用 该 表 则 该 语句 将 失败 。 









DB2 UDB | INFORMIX | X/Open, SQL-99 


CASCADE | (CASCADE 
IRESTRICT] | IRESTRICTI 


ICASCADE | ICASCADE 
IRESTRICT] | IRESTRICT} 


ORACLE 


(CASCADE 
DROP TABLE tablename. .. CONSTRAINTTS| 
DROP VIEW viewname. .. | 


图 7-14 各 种 产品 和 标 淮 中 的 Drop Tablie 和 和 Drop View 语 句 
如 图 7-14 所 示 ，DB2 UDB 中 的 简单 形式 如 下 : 


DROP {TABLE tablename | YIEW viewname}: 
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DB2 UDB 遇 除 一 个 表 或 视图 时 ， 基 于 它 的 视图 和 触发 器 都 将 被 变 成 无 效 的 。 它 们 的 定 
义 仍 然 保 留 在 系统 日 录 中 ,但 上 只 有 当 表 被 重建 后 ， 它 们 才 是 有 效 的 。 引 用 该 表 的 约 东 间 时 被 
删除 。 

INFORMIX 删 除 一 个 表 或 视图 时 ， 基 于 它 的 触发 器 变 成 无 效 的 。 如 果 用 CASCADE 子 句 ， 
将 删除 引用 该 专 的 视图 和 5 引用 约束 ， 而 用 RESTRICT 子 句 时 ， 不 允许 删除 被 视图 或 引用 约束 引 
用 的 表 。 

1. 可 更 新 视图 和 只 读 视 图 

视图 并 不 是 每 个 方面 都 像 基本 表 一 样 灵活 ， 有 些 视图 不 能 被 中 新 。 不 允许 更 新 的 最 充分 
理由 是 ， 有 时 不 知 拥 如 何 将 对 视图 的 抱 新 转化 成 对 其 基本 表 的 更 新 ， 以 上 反映 视图 的 创建 者 和 
提出 完 新 要 求 的 用 户 的 意图 ， 们 限制 视图 更 新 的 一 些 规则 解决 了 这 个 问题 ， 能 够 将 对 视图 的 
更 新 转化 成 对 其 基本 表 的 更 新 。 特 别 是 ， 在 很 多 数据 库 产 品 中 ， 册 连接 操作 得 到 的 视图 都 不 
能 被 更 新 ， 虽 然 对 大 多 数列 的 更 新 都 能 简单 地 转化 成 相应 的 对 基本 表 的 更 新 。 本 章 最 后 的 习 
题 中 有 关于 这 方面 的 内 容 。 

在 基本 SQL 中 ， 视 图 是 可 更 新 的 或 只 读 的 。 可 更 新 视图 介 许 Insert、Update 和 Delete 操 作 ， 
而 具 读 视图 则 不 多 许 《 注 意 ， 所 有 的 基本 表 都 被 认为 是 可 揭 新 的 }。 图 7-15 给 出 了 在 X/Open 中 
时 新 视图 时 必须 遵循 的 标准 规则 . 


若 视 图 的 子 查 询 语 名 满足 以 下 条 件 ， 则 称 它 汶 可 更新 的 。 
1) 子 查询 的 FROQM 子 铝 上 只 也 括 一 个 表 ， 而 且 如 果 这 个 表 基 视图 表 ， 则 一 定 基 可 更 新 的 视图 ， 
2 不 出 现 GROUP BY 和 HAWwING 子 铝 。 


3) 没有 司 用 DISTINCT 关 键 字 。 

小 WHEREFE 了 于 名 中 ， 没 有 子 杏 询 直接 或 间接 地 道 过 视图 引用 FROM 子 人 争 的 表 ， 

引 所 有 由 子 查 询 得 天 的 列 各 都 是 简单 的 ( 即 没 有 类 似 于 avgtqty) 或 qty+100 的 算术 表达 式 )， 在 不 同 的 
结果 列 中 也 没有 列 省 重复 出 现 。 





图 7-15 X/Open 对 村 更 新 视图 的 子 查 询 语句 的 限制 


我 们 将 用 例子 说 明 有 这 些 限 制 的 原因 。 
例 7.2.6 下 面 是 一 个 称 交 colocated 的 视图 的 定义 : 


create view colocated as select cid, chame, a1d, aname, .City as acity 
from customers c, agents a where tC.city = a.city: 


这 个 视图 列 出 了 在 同一 个 城市 里 的 磊 客 和 代理 商 ， 这 便于 将 他 们 邀请 出 来 ， 介 绍 他 们 互 
相 认 识 。 假 定 在 图 z-2 的 CAP 数 据 库 中 ， 视 图 有 两 行 分 别 是 


CO2 Basics 总 间 牛 的 1 本 hh Dallas 
利 
[| 上 由 1 11ieed 0 smith 0allas 


但 视图 的 定义 违 友 了 上 面 的 第 1 条 规则 ， 因 为 FROM 于 各 包括 不 止 一 个 表 ， 因 此 这 个 视图 
说 限定 为 内 讯 的， 而 不 是 可 更 新 的 。 让 我 们 试 着 并 过 观 查 一 些 雇用 到 视图 的 Update 垣 名 来 理 
解 这 一 限制 。 先 提 一 个 问题 ， 如 来 我 们 要 将 上 面 第 二 行 ( 即 cia = ‘e003” ，aigd = “a06 
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的 那 一 行 ) 中 的 aname 从 Smith 改 为 Franklin， 相 应 地 要 对 基本 表 做 显 些 修改 ” 显然 ， 如 果 a06 
代理 商 将 其 名 字 改 为 Franklin， 上 面 的 第 一 行 也 要 改 ， 所 以 对 视图 中 一 行 的 修改 会 对 其 他 行 带 
来 不 可 预料 的 副作用 。 我 们 不 希望 在 基本 表 中 出 现 这 种 情况 。 

如 果 删 除 第 二 行情 癌 艾 略 有 不 同 。 这 时 应 该 对 基本 表 进 行 哪些 修改 呢 ? 是 删 掉 表 
customers 中 c003 的 一 整 行 ， 还 是 删 掉 表 agents 中 a06 的 一 整 行 。 还 基 改 襟 其 中 一 个 表 的 
city 值 ( 改 成 什么 呢 ? )， 或 是 做 一 些 别 的 什么 修改 ”类似 地， 如 果 我 们 想 播 人 一 个 新 行 ; 


愉 03 Allied alz2 Watanasbe Dallas 


似乎 是 霸 表 agents 中 新 建 了 一 行 ，al2 Watanabe Dallas，Percemtr 字 段 为 空 。 我 们 同 
样 必 须 在 视图 中 搬 人 人 一行， 将 顾客 c002 与 代理 商 a12 联 系 起 来 ， 这 同样 可 能 有 不 可 预料 的 副 
作用 。 

为 避免 这 类 复 林 的 情况 ,标准 规定 FROM 了 于 名 中 只 能 有 -~ 个 表 。 少 数 采取 了 复杂 措施 的 
数据 库 允 许 在 连接 视图 上 进行 有 限 的 修改 ， 我 们 将 在 练习 中 进行 这 方面 的 考虑 。 国 

下 面 一 个 例 于 说 明 图 7-15 中 的 第 2 条 规则 。 

例 7.2.7 ”我们 定义 一 个 称 为 agentsales 的 视图 ， 包 含 所 有 下 过 订单 的 代理 商 的 aiad 值 


create view agqentsales taid, totsales} as select aid, sumtdollarsy) 


from orders group by aid; 

根据 上 和 面 的 第 2 条 规则 ， 视 图 有 GROUP BY 子 句 ， 因 此 是 不 可 更 新 的 。 给 出 这 条 约束 的 用 

由 同样 是 因为 雹 法 将 对 视图 上 的 更 新 直接 转换 成 对 基本 表 的 更 新 。 例 如 ， 假 设 我 们 想 通过 表 
agentsales 将 代理 商 a01 的 销售 总 额 增加 $1000.00。 


Update agentsales 
set totsales = totsales + 1000,00: i* TILLEGBAL SYNTAX ni 


这 样 更 新 的 问题 是 ， 我 们 不 知道 应 加 入 什么 信息 才能 让 更 新 在 基本 表 orders 中 体现 出 
来 。 对 于 代理 商 a01 加 人 到 表 orders 中 的 订单 的 cid 和 Pia 值 是 什么 呢 ? 到 底 是 增加 一 个 订 
单 ， 还 是 几 个 订单 呢 ? 或 者 表 orders 的 一 行 或 多 行 的 dollars 都 变 成 全 大 的 值 ? 这 些 我 们 都 
不 得 面 知 。 国 

再 重复 一 次 ， 如 果 我 们 杯 确 切 地 知道 对 视图 的 更 新 应 该 怎样 及 晓 到 基本 表 上 ， 就 不 能 允 
许 其 发 生 。 因 此 ， 第 3 条 规则 要 求 可 更 新 的 视图 中 没有 关键 词 distinct 也 是 很 容易 理解 的 。 如 果 
视图 中 的 一 行 在 基本 表 中 存在 同样 的 好 几 行 ， 当 要 求 更 新 指定 行 的 一 个 属性 时 ， 应 该 怎么 办 
呢 ? 是 更 新 基本 表 中 的 一 行 ， 还 是 所 有 这 样 的 行 ? 

有 些 由 连接 得 到 的 视图 可 以 被 安全 地 更 新 。ORACLE 人 允许 对 连接 视图 进行 更 新 ， 如 果 连 
接 是 N-1 (多 对 一 ) 的 ， 而 且 N 方 有 主键 ( 这 样 得 到 的 是 无 损 连 接 )。 例 如 ， 例 7.2.1 中 的 
orders 视 图 就 具备 这 些 特性 ， 及 以 在 OQRACLE 中 视图 agentorders 是 可 里 新 的 。 但 是 我 们 
只 能 更 新 与 表 orders 一 对 一 的 列 ， 不 能 更 新 列 aname，acity 和 percent， 也 不 能 修改 决 
定 连 接 的 列 aia。 为 列 出 这 个 视图 中 可 以 更 新 的 行 ， 我 们 可 以 对 ORACLE 的 数据 宁 典 视图 
user_upaatable columns 执 行 下 面 移 Select 语 名 : 


select column_name, updatable from user_updatable columns 
where table name = AGENTORDERS': 
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2. 视图 的 值 

第 1 章 中 提 到 了 集中 控制 的 数据 会 产生 的 一 些 问 题 。 第 一 是 如 缉 复 杂 性 。 例 如 ， 一 个 验证 
大 学 学 生 保险 费 的 应 用 程序 为 获得 所 需 的 列 信息 ， 要 访问 很 多 表 ， 而 有 日 这 些 表 中 很 多 表 的 名 
字 、 用 途 与 健康 保险 是 完全 没有 关系 的 。 结 果 ， 要 培训 一 个 新 的 应 用 程序 员 在 这 么 和 多 表 中 导 
航 十 非常 困难 的 。 集 中 控制 的 第 二 个 目标 是 分 段 实现 ， 每 当 引 入 新 的 数据 库 时 ， 集 中 控制 的 
好 好 就 增加 一 点 。 当 出 现 新 表 ， 需要 用 新 的 列 名 访问 旧 的 列 名 时 ， 我 们 不 希望 为 了 消除 数据 
见 余 而 重 写 应 用 程序 。 理 想 的 情 帝 是 ， 我 们 希望 有 一 些 办 法 确保 表 的 增加 不 给 培训 带 来 问题 ， 
并 且 当 为 了 消除 数据 元 余 而 重新 组 织 老 的 表 ， 或 用 新 的 表 取 代 它 们 时 ， 不 需要 修改 原来 应 用 
程序 的 代码 。 视 图-- 般 可 用 来 解决 这 两 个 问题 以 及 其 他 问题 。 

1) 视图 提供 了 一 种 方法 ， 使 复杂 的 、 经 常用 到 的 查询 写 息 来 更 容易 ， 这 一 点 我 们 可 以 从 
例 7.2.2 中 看 出 来 ， 我 们 可 以 写 查询 

select sumtcharge} from agentorders Where city -= ‘Toledo': 

而 不 用 写 

select sumto.dollars) from orders Oo, agents a 

Where o.aid = a.ald and a.city = ‘Toledo':; 


以 前 ， 岂 乎 人 每 个 查询 前 要 用 到 表 的 连接 和 复杂 的 搜索 和 条件， 现在， 视图 可 以 隐藏 这 种 复 
洒 性 ， 亿 过 对 系统 不 辐 风 的 子 查询 的 履 改 来 实现 复杂 的 查询 。( 在 实际 应 用 中 .视图 通常 隐 党 
了 很 多 复杂 性 .) 
2) 视图 允许 过 时 的 表 和 引用 过 时 和 才 的 程序 不 被 重新 组 织 。 试 想 将 表 orders 重 组 成 - -个 新 
表 ords : 
create table ords fordno integer not nu11，month char(t3), 
custid chart#) net nuT1，agantid char{3Y mot nuil., 
prodid chart3}) not null]， 
quantity integer default null checkioquantity Y= 0)., 
primary key (ordney, 
foreign key {cid) references customers. 
foreign key {aid) references agents ， 
foretygn key (pid} references products); 


我 们 已 经 对 cid，aid 和 pid 列 重新 命 了 和 名， 并 从 表 orders 中 去 除了 列 4ollars; 现在 
我 们 想 用 quantity 值 和 被 订货 物 的 单价 相 莱 来 得 到 表 orders 中 每 一 行 的 dollars 总 额 ， 
如 果 有 很 多 程序 访问 亏 的 orders 表 ， 我 们 可 以 为 新 组 织 的 ords 表 和 products 表 建立 -个 
视图 ， 让 这 些 程 序 使 用 。 

create view orders tordno, month,. cid, aid, pid. qty. doliars) as 

select ordno, month, custid, agent1d, prodid, 


mquantity, m.quantity*price 
from products p, ords m where m.prodid = p.pid; 


通过 这 种 方法 ， 可 以 使 程序 对 数据 的 访问 独立 于 其 物理 结构 的 改变 ， 这 一 特性 被 称 为 程 
序数 据 儿 立 性 ， 我 们 曾 在 第 1 章 中 提 到 过 ( 定 儿 1.3.1 )。 注 意 到 独立 性 并 不 完全 ， 因 为 视图 
orders 的 子 查询 中 包含 两 个 表 ， 所 以 不 能 通过 视图 crders 来 更 新 数据 ; 这 意味 着 输入 新 订 


单 的 程序 迎 辑 要 重 写 。 
3) 视图 加 入 了 一 种 安全 措施 ， 让 不 同 的 用 户 以 不 同 的 方式 看 相间 的 数据 。 和 集中 控制 的 数 


据 支 持 数 据 管 理 的 一 条 重要 原则 : 任何 对 企业 至 关 重 要 的 信息 都 只 能 有 一 个 副本 。 其 危险 在 
于 ， 如 果 副 本 多 于 一 个 ， 各 版 本 可 能 不 能 保持 同步 《在 一 个 经 纪 业务 中 ， 同 一 个 股票 可 能 被 
列 出 两 入 不 同 的 价格 ;， 这 样 就 可 能 造成 错误 的 决定 。 市 有 是， 实际 中 也 不 能 让 每 个 人 都 有 访问 
所 有 信息 的 权利 。 员 工 的 办 公 室 地 点 、 号 码 等 可 以 计 其 他 同事 知道 ， 而 薪水 只 有 经 理 、 人 力 
资源 部 和 财务 处 才能 得 到、 而 平时 表现 只 有 经 理 和 人 力 资源 部 能 得 到 。 

我 们 可 以 对 同一 个 emp loyees 表 建立 不 同 的 视图 ， 对 访问 这 些 视图 的 不 同 用 户 采 用 不 同 
的 安全 措施 ， 见 下 一 节 授 予 安全 权限 的 6rant 语 句 。 在 授权 一 类 用 户 访 问 某 个 视图 和 限制 他 
们 访问 基本 表 时 ， 自 动 地 为 视图 中 没有 命名 的 字段 提供 安全 性 。 


7.3 安全 性 : SQL 中 的 Grant 语 句 


Grant 语 句 是 表 ( 基本 表 或 视图 } 所 有 者 授予 一 个 或 一 类 用 户 访问 表 的 种 种 权利 的 SQL 命 
令 。 这 是 访问 表 的 安全 性 的 一 种 形式 ， 访 癌 列 的 安 伞 性 也 可 以 通过 帘 图 实现 。 其 他 用 户 首先 
必须 能 够 连 上 包含 表 的 数据 库 , 这 项 权限 是 由 DBA 授 予 的 。 

例 7.3.1 表 customers 的 所 有 省 只 给 用 “eoneil” 账 户 登 录 的 用 户 Select 权 限 。 

grant select on customers to eoneil:; | 


基本 SQL 的 Grant 语句 形式 【与 XAObpen 等 价 ) 如 图 7-16 所 示 。 


GRANT {ALL PAHIYILEGES | privilege (, privilege...}} 
ON CTABLE] tablename | viewname 


To {PUBLIC | user name 1, user-name...} } [WITH GRANT DOPTION] 





图 7-16 基本 SQL 的 Grant 庄 句 形 式 
Grant 命令 可 以 授予 下 面 列 出 的 所 有 访问 权限 ， 也 可 以 给 出 用 逗 导 隔 开 的 一 个 权限 序列 。 


SELECT 

DELETE 

INSERT 

UPDATE [eolumname {, columnname,..}] 
REFERENCES [eolumnname {, columnname...}] 


形 如 (SELECT，DELETE，… ) 的 权限 给 予 现在 、 将 来 的 用 户 (在 PUBLIC 中 ) 或 其 他 
指定 的 用 户 名 列表 使 用 带 有 表 和 名 /视图 名 作为 对 象 的 相应 SQL 语 名 的 权利 ; REFERENCES 权 限 
允许 用 户 在 引用 该 表 的 表 上 建立 外 键 约束 。 如 果 UPDPATE 权 眼中 没有 指定 列 名 列表 ， 表 中 现 
有 或 将 会 有 的 所 有 列 都 加 上 这 一 权限 。 可 选 的 WITH GRANT OPTION 子 句 人 允许 有 这 个 权限 的 
用 户 授予 其 他 用 户 同 样 的 权限 。 基 本 SQL 中 所 有 的 Grant 青 句 的 语法 ORACLE、DB2 UDB 和 
INFORMIX 也 支持 。Grant 语 句 塌 可 以 用 在 艇 入 式 SQL 程 序 中 。 

表 的 所 有 者 自动 拥有 所 有 权限 ， 而 且 不 能 被 取消 。 要 授予 其 他 用 户 与 访问 视图 相关 的 权 
利 ， 授 权 者 必须 拥有 该 视图 表 ( 面 且 在 生成 视图 的 所 有 表 上 有 必要 的 权限 ) 或 已 经 通过 WITH 
GRANT OPTION 子 句 被 授 陡 了 这 些 权 限 。 若 要 在 一 个 视图 上 授 耶 插入、 删除 或 更 新 权限 ， 视 
图 必须 是 可 喝 新 的 。 


例 7.3.2 授予 用 户 eoneil 对 表 orders 的 选取 、 对 新 或 插 人 人 权限， 但 不 给 删除 权限 ， 然 后 


一 
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给 予 eoneil 在 表 products 上 的 所 有 权限 。 


drant select, update, insert on orders to ecore1lT: 
grant all privileges or products to eoneil: 是 


我 们 可 以 在 创建 视图 时 使 用 Grant 语句 ， 提 供 字段 安全 性 。 对 视图 使 用 Grant 语句 ， 而 不 对 
支持 它 的 视图 或 基本 表 使 用 ， 同 样 可 以 达到 预期 效果 。 


例 7.3.3 ”允许 用 户 coneil 在 家 customers 中 插入 或 删除 任意 行 ， 但 只 能 更 新 cname 和 
city 列 ， 可 以 选取 除 discnt 外 的 所 有 列 。 因 为 没有 与 选取 权限 相关 的 字段 说 明 ， 表 所 有 者 
先 创建 一 个 视图 custview; 

Create view custview as Select cid, cname, city from CUstomers: 
现在 所 有 者 可 以 在 custview 视 图 上 提供 需要 的 授权 : 


grant salect, deiete, insert, update (cname, city) on custyview 


to eoneil: 
因为 在 基本 表 customers 中 ，eoneil 没 有 被 授予 任何 权限 ， 所 以 他 不能 选取 列 4i scnt 的 
值 . | 
用 视图 还 可 以 对 从 表 中 被 选取 出 来 的 行 的 子 集 进行 授权 。 
例 7.3.4 允许 用 户 eoneil 对 表 agents 中 所 有 percent 太 十 5 的 行进 行 所 有 访问 。 


Create view agertview as Select * from agents where pertent » 5: 


grant all privileges on agentvyiaw to eoneil; 
|] 


X/Open SQL 中 撤消 对 一 个 表 的 权限 的 SQL 语句 的 一 般 形式 如 下 (基本 SQL 目前 不 支持 
{CASCADE | RESTRICT} 子 句 )。 


REVOKE LALL PRIVILEGES | privilege L, privilege...} | 
ON tablename | viewname 
FROM {PUBLIC | user-name {. user-name...} } 
[CASCTADE | RESTRICT}: -- One of these 1s regquired ir Xiopen 


Revoke 语 可 可 以 取消 以 前 授予 用 户 的 一 些 权 限 。 与 Grant 语 人 名 不 同 ， 在 撤销 更 新 权限 时 不 
能 指定 列 名 。 前 面 说 过 ， 表 的 所 有 者 自动 提 有 所 有 权限 ， 它 们 是 不 能 被 撤消 的 。Revoke 语 名 
可 以 用 在 典 人 式 SQL 中 ， 如 果 试 图 撤消 一 个 原来 设 有 授权 的 权限 ， 将 会 导致 SQLWARNING 情 
况 ， 而 不 是 SQLERROR ， 后 者 不 为 标准 所 提倡。 

XIOpen 中 ，CASCADE 选 项 的 作用 是 删除 与 当前 被 撤销 的 权限 有 依赖 关系 的 视图 (要 建 
立 视 图 ， 必 须 在 基本 家 上 有 SELECT 权 限 } 或 删除 依赖 于 REFERENCES 权 限 的 FOREIGN 
KEY 约 束 。RESTRICT 选 项 与 CASCADE 不 同 ， 如 果 有 这 样 的 依赖 关系 ， 将 不 多 许 执 行 Revoke 
语句 。 

注意 ，ORACLE 和 DB2 UDB 中 都 没有 实现 这 样 的 必 选 的 CASCADE | RESTRICT 了 于 何 ， 
INFORMIX 中 将 其 作为 可 选 子 杀 ， 缺 省 值 为 CASCADE。ORACLE 中 语法 的 相应 位 置 是 一 个 
可 选 的 CASCADE CONSTRAINTS 子 句 ， 这 将 使 系统 只 删除 与 被 撤消 的 REFERENCES 权 限 有 
关 的 参照 完整 性 约束 。DB2 UDB 中 没有 语法 控制 这 种 动作 ， 当 一 个 权限 被 撤销 时 ， 三 个 产品 
中 与 其 有 关 的 视图 都 缺 省 地 变 成 无 效 的 。 
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数据 库 产 品 间 的 不 同 

ORACLE、DB2 UDB 和 INFORMIX 产 品 都 支持 X/Open SQL 标准 的 Grant 和 Revoke 语 句 的 语法 ， 
只 是 在 刚才 说 到 的 CASCADE | RESTRICT 子 句 等 细节 方面 略 有 不 同 ， 但 二 种 产 师 浆 都 在 很 多 附加 
的 权限 -。 例如 ，DORACLE 有 一 种 叫做 DBA 的 权限 ， 有 了 它 用 户 才能 执行 本 竟 介 绍 的 大 部 分 SQL 命 
仿 。 另 外，OQRACLE 中 的 连接 tconnect} 权 限 允 许 用 户 进入 数据 库 ， 资 源 (resource}) 权 限 允 许 用 户 创 
建 碟 、 索 引 等 占用 伐 盘 空间 的 数据 库 对 象 。 想 了 解 ODRACLE 有 关 这 方面 的 更 客 细 节 ， 请 参阅 本 音 
最 后 的 “推荐 读物 ”的 推荐 读物 |13] 《ORACLES Server SOL Reference Manual》( 《ORACLE8 服 务 
SQL 参考 手册 》) 和 推荐 读物 [12])《ORACLES Server Concepis》(《ORACLE8 服 务 概念 》)， 

DB2 UDB 中 也 有 很 多 附加 的 权限 。 它 有 DBADM 权 限 ， 使 用 户 可 以 访问 和 修改 数据 库 中 的 所 有 
表 . 视图 等 ，CONNECT 权 限 有 人 允许 用 户 创 建 表 的 CREATETAB 权 上限， 还 有 许多 表 一 级 的 附加 权限 。 
参见 推荐 读物 [ 《4 Compiete Guide to DB2 Universal Database 》( 《DB2 通 用 数据 库 完 全 指南 》). 


7.4 系统 目录 和 模式 


所 有 的 关系 数据 库 系 统 都 有 系统 目录 ， 凤 由 系统 维护 的 ， 包含 数据 库 中 定义 的 对 象 的 入 
息 的 表 ( 或 视图 )。 这 些 对 象 包括 用 Create Table 语 句 定义 的 表 、 列 、 索 引 、 视 图 、 权 限 、 约 东 
和 圭 。 例如 ， 在 X/Dpen 标 准 中 ， 目 录 表 INFO_SCHEM.TABLES 的 一 行 就 是 -个 已 定 立 的 表 的 信 
息 ， 下面 足 XADpen 的 INFO_SCHEM.TABLES 系 统 视 图 中 的 几 个 列 。 


[INFO_SCHEM.TABLES 






TARIL EF._SCHEM 表 的 模式 名 (通常 电表 所 有 首 的 用 户 省 ) 
TABLE NANME 表 各 


TABLE_TYPE ‘BASE_TABLE 或 VER 


其 他 地 方 的 DBA 需 要 引用 这 样 的 目录 表 以 获取 本 地 数据 库 设 计 的 一 些 情况 。DBA 用 普通 
的 SQL Select 语 名 来 获取 这 些 人 信息。 例如 ，select TABLFE_NAME from TaBLES。 执 行动 
态 SQL 的 应 用 程序 为 了 作出 某 个 雇 定 可 能 需 委 访问 目录 表 。 人 例如， 要 知 道 基 个 表 中 询 的 数 日 
和 名 称 。 数 据 库 系统 本 身 也 根据 目录 表 来 转化 视图 上 的 查 调 ， 对 运行 期 的 更 新 语句 加 上 约束 。 
( 但 是 ， 系 统 用 的 肯定 是 比较 有 效 的 方法 ， 而 不 是 直接 用 Sejlect 语 名 访问 日 录 表 的 列 ， 所 以 提 
到 这 一 点 时 应 该 十 分 小 心 。 目 录 表 可 以 看 做 是 程序 的 源 代码 ， 为 使 执行 效率 更 高 可 以 进行 某 
种 编译 。 例 如 ， 通 过 检索 所 有 可 以 实施 的 约 刘 ， 让 系统 回应 已 经 提交 的 动态 Update 语 可 。) 

每 个 商用 数据 库 都 有 一 套 不 同 结构 的 目录 表 名 ， 而 且 每 个 数据 库 用 不 问 的 术语 来 指 代 它 
们 。DB2 UDB 中 叫做 目录 表 ; INFORMIX 中 喇 做 系统 目录 其实 也 是 表格 ) ; ORACLE 中 叫 
做 数据 字典 (是 一 些 由 系统 维护 的 视图 ) ;而 XAOpen 标 准 中 叫做 系统 视图 。 目 录 表 是 在 建立 
数据 库 时 建立 的 ， 目 录 的 基本 表 只 能 由 系统 根据 数据 定 交 语句 和 其 他 类 型 的 语句 进行 更 新 。 
通常 ， 用 广 不 能 自 接 更 新 目录 素 ， 因 为 这 可 能 破坏 数据 完整 性 例如， 用 户 删 除 TABLES 中 的 
一 行 ， 而 该 行 对 应 的 表 对 象 还 没有 被 删除 }。 很 多 产品 只 允许 用 户 通 过 只 读 视 图 ( 即 只 授予 
PUBLIC SELECT 权限 ) 访问 目录 表 以 保证 不 发 生 更 新 ,但 有 些 产 品 (特别 是 DB2 UDB; 允 
许 PBA 用 修改 目录 表 的 数据 ， 使 查询 优化 器 选择 更 好 的 查 淘 方 案 。 

日 录 表 中 的 信息 有 时 称 为 元 数据 ， 意 思 是 “关于 数据 的 数据 ”。 元 数据 甚至 是 目 描 述 的 ， 
因为 月 录 表 TABLES 中 有 一 行 是 描述 表 TABLES 的 (TABLES 也 可 能 是 视图 类 型 )。 下面， 我 
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们 将 用 大 写字 母 表示 目录 表 和 名 。 

注意 ，ORACLE 和 DB2 UDB 的 目录 表 中 的 对 象 标识 符 都 是 大 写 的 ， 而 INFORMIX 中 是 小 
与 的 .“” 

当 一 个 用 户 用 Create Table 语 各 定义 表 orders 夺 ，TABLES 中 将 输入 表 名 ORDERS。 同样 ， 
当 用 户 用 大 小 写 混合 的 名 字 一 一 0rders 或 0rdErs 定 尺 表 时 ， 有 目录 中 的 对 象 应 写作 ORDERS。 
当 用 户 在 Select 请 句 的 WHERE 子 句 中 使 用 对 象 名 时 ， 这 是 非常 重要 的 。 

1. 模式 

Core SQL-99 中 模式 是 表 ， 索引 及 其 他 与 数据 库 有 关 的 对 锭 的 集 台 ， 这 些 对 象 通 常 是 为 单 
个 用 户 设计 的 。 歼 据 库 月 录 中 表 的 完整 名 是 模式 名 .表格 名 ( 模式 名 通常 是 一 个 用 户 名 }， 其 
他 数据 库 对 象 的 命名 也 是 如 此 。 这 样 的 命名 系统 允许 不 同 的 用 户 【《 如 一 个 班级 里 的 所 有 学 生 ) 
使 用 同名 的 表 ， 而 不 会 在 整个 数据 库 中 造成 混 清 。 有 些 数据 库 中 ， 除 每 个 用 户 一 个 模式 外 ， 
系统 还 使 用 附加 模式 来 容纳 表 和 其 他 对 象 的 相关 集 ， 如 DB2 UDB 中 的 SYSCAT 模 式 和 
ORACLE 中 的 PUBLIC 模 式 。 

在 Core SQL-99 和 和 当前 大 和 多数 产品 中 ， 当 用 户 的 数据 库 账 户 建 立时 ， 其 模式 在 用 户 名 之 后 
给 出 ,他 们 不 能 再 建立 其 他 模式 。SQL-99 的 一 个 扩展 特性 是 允许 用 户 建 立 附 加 模式 ， 由 用 户 
给 定 模 式 名 和 对 象 所 有 权 。 下 面 是 Create Schema 语 句 的 语法 。 

CEXEC SOL] CREATE SCHEMA 

{schemaname | AUTHORIZATION authorizatfion_id]} 
[ischema _ element schema element -..]]: 

XIOpen 的 语法 与 其 相同 ， 只 是 还 有 一 个 给 定 字符 集 的 出 加 可 选 子 如 。Cere SQL-99 和 
XiOpen 中 ， 可 选 的 schema_element 是 下 列 $SQL 语 句 ，Create Table，Create View, Create Index 
和 Grant。 它 们 以 正确 的 所 有 权 来 为 新 模式 提供 初始 肉 容 。 用 户 只 须 给 出 模式 名 ， 
AUTHORIZATION 利 schema_element 选 项 可 以 跳 过 ， 接 着 在 新 模式 中 创建 表 和 其 他 对 象 . 在 
我 们 介绍 的 三 种 产品 中 ,目前 只 有 DB2 UDB 人 允许 用 户 建 立 阶 加 模式 。 其 他 产品 的 文档 中 ,“ 模 
式 名 ”用 “所 有 者 名 ”或 “用 户 名 ”代替 。 

2. 教 据 库 产品 间 目 录 的 不 同 

因为 每 个 数据 库 产品 对 目录 表 的 约定 都 不 同 ， 所 谓 的 标准 只 能 给 出 一 个 什么 表 和 列 必 须 
存在 的 概念 。 本 小 节 对 ORACLE、DB2 UDB 和 INFORMIX 中 的 目录 表 进行 简 要 的 描述 。 描 述 
不 是 很 完全 的 ， 要 了 解 具 体 细 节 ， 请 查阅 相关 的 产品 指责 。 








(1) ORACLE 数据 字典 

ORACLE 数 据 字 典 由 视图 组 成 ， 根 据 前 织 宫 分 为 三 种 不 同 的 形式 : 
前 统 用 泛 

USER_ 用 户 视 图 【用户 所 有 的 对 和 蒙 ， 在 出 户 模式 中 ) 

ALL _ 扩展 的 用 户 视图 {用户 可 以 访问 的 对 象 ) 

DBA_ BPBA 视 图 《 研 有 用 户 都 可 以 访问 的 DBA 对 得 的 子 集 ) 


马 “” 实际 上 ，SQL 标 识 符 旺 不 分 大 小 写 的 。 解 释 见 例 3.9.1 后 面 的 小 他 “标识 符 "。 当 对 日 法 的 查 痪 中 的 表 和 为 
小 写字 峡 时 ， 将 被 查 询 处 理 器 作为 字符 绅 数 据 处 理 ， 即 按照 字符 单 的 字面 意思 甫 释 ， 而 不 去 下 配 目录 表 中 
的 太 写 字母 。INFORMIX 目 录 中 的 表 名 不 是 大 写字 各， 是 小 写字 母 。 
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例如 ， 字 典 中 有 USER_TABLES、ALL TABLES 和 DBA_TABLES 视 图 。ALL_TABLES 和 
DBA_TABLES 帘 图 有 很 多 列 ， 其 中 很 多 都 是 与 磁 失 存储 和 Create Table 语 可 中 的 更 新 事务 子 避 
有 关 的 .前面 我 们 没有 给 出 。 下面 是 我 们 感 兴 趣 的 一 些 列 。 

ALL_TARLES (或 DBA TABEES) 
列 名 描述 















Re 
蓄 盘 存储 和 更 新 事务 信息 


与 ALL_TABLES 不 同 ，USER_TARLES 视 图 没有 GWNER 列 ， 因 为 根据 定义 ， 表 的 所 有 者 
就 是 当前 用 户 。( 实际 上 ，USER_TABLES 视 图 是 根据 ALL TABLES 视 图 定义 的 ， 从 
ALL_TABLES 中 选 出 QWNER = 当前 用 户 的 行 ， 但 结果 中 不 地 珊 OWNER 州 。)】 

用 户 可 以 访问 的 所 有 表 和 和 视图 (还 有 素 艇 ，ORACLE 中 定义 的 一 种 类 似 于 表 的 结构 ) 的 
列 的 信息 都 存放 在 ACCESSIBLE_COLUMNS 视 图 和 辐 义 的 ALL_TAHB_COLUMNS 视 图 中 。 
DBA_TAB_COLUMNS 有 相同 的 结构 ，USER_TAB_COLUMNS 除 了 没有 DOWNER 列 之 外 也 
相同 。 

ALL TAB COEUMNS {或 ACCESSIBLE COLUMNS) 


其 他 属性 ; 空 值 ? 缺 省 值 ? 等 

ALL TAB_COLUMNS 的 主键 显然 包括 TABLE_ NAME 和 COLUMN NAME ， 因 为 不 同 的 
表 可 能 有 相同 的 列 各， 不 同 的 有 用户 也 可 能 使 用 相同 的 表 名 。 为 了 在 SQL 中 区 分 出 这 些 名 字 ， 
表 可 以 用 用 户 名 【又 称 为 模式 名 ) 来 限定 : 用 记名 . 表 名 (username .tablename) 这 样 ， 
访问 由 poneil 创 建 的 coraers 表 中 的 列 ( 当前 用 户 不 是 poneil, 但 有 访 全 orders 表 的 权限 )， 
可 以 用 Select 诸 句 : 


select tolumn_name from ali_tab_columns 
where Owner = "PONEIL' and table_name 一 “RDERS” : 


总 是 有 比较 简单 的 方法 来 描述 用 户 已 经 创建 的 表 中 的 列 ， 例 如 用 SQL *pPius 的 命令 ; 





















describe Drders ; 


Describe 命 令 也 可 用 于 用 户 定义 的 视图 和 系统 定义 的 表 和 视图 ， 俱 ORACLE 8i 版 本 
( 8.1.5 或 更 早 的 版 本 ) 的 用 户 必须 用 一 个 特殊 的 前 缀 来 修饰 系统 定义 的 对 象 名 ， 如 下 : 

describe “PUBEIC™. USER TABLES: 

注意 ， 前 级" PUBLIC' 必须 用 双 引 号 括 起 来 ， 而 朋 要 用 大 写字 母 ( 见 例 3.9.1 后 的 “ 标 误 
符 ” 小 节 中 对 用 双 引 号 括 起 来 的 字符 捉 的 解释 )。ORACLE 中 还 有 称 为 
ALL TAB_COMMENTS 和 ALL_COL_COMMENTS 的 目录 视图 ( 以 及 相关 的 USER_ 和 DBA_ 
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空 量 ) 来 包含 描述 被 菜 些 假 定 会 米 访 问 的 DBA 使 用 的 表 和 列 的 搞 述 。ORACLE 语 言 有 一 种 非 
标准 的 SOL 语 名 :; COMMENT ON tablename | tablename.columname IS 'text', 
用 这 条 语句， 可 以 对 拥有 的 什 何 一 个 表 或 列 加 文字 注释 。 

另外 ，ORACLE 有 相对 标准 的 日 录 视 图 TABLE_PRIVILEGES (或 ALL_ TAB_GRANTS ) 
和 COLUMN_PRIVILEGES (或 ALL_COL_GRANTS )， 列 出 可 访问 表 上 的 权限 ,还 有 
CONSTRAINT_DEFS (或 ALL_CONSTRAINTS )， 列 出 可 访问 直上 的 约束 。 视 图 
DICTIONARY 列 出 所 有 的 数据 字典 志和 视图 的 名字 ( TABLE_NAMES ) 及 描述 件 注 释 
(COMMENTS )， 视 图 DICT_COLUMNS 列 出 这 些 字 典 列 和 视图 的 所 有 列 (TABLE_NAME 、 
COLUMNA_NAME 作 为 主键 ) 和 描述 性 注释 (COMMENTS 列 )。 我 们 没有 提 到 的 其 他 对 象 ， 
也 在 目录 中 列 出 ， 如 索引 并 根据 需要 对 它 进 行 说 明 。 有 关 用 户 和 性 能 的 统计 信息 也 记 承 在 数 
据 字 血 中 ， 我 们 将 在 第 9 章 中 介绍 性 能 统计 信息 。 

用 户 可 以 用 如 下 的 SQL*Plus 序 列 创建 系统 定义 的 视图 的 列表 ， 


spPool Yigew.names -- or whatever file name yeu wAant to use 
splect view name from a1ll views where Owner = SFI" 
and vtew name Tike ALL % or view_name 1fke “USER %’.; 


要 知道 一 个 视图 ， 如 agentorders,， 虹 初 在 ORACLE 中 大 怎样 定义 的 |， 可 以 用 如 下 语句: 

3elect text from User views where view name = "AGENTORDERS"; | 

在 7.2 市 之 前 的 触发 侨 定 义 中 ， 我 们 蚂 提 到 过 设置 文本 的 显示 长 度 。 用 SQL*Plus 的 set 
1 ong 命 令 可 以 增加 文本 显示 长 度 ， 其 缺 省 值 为 8 个 字符 : 


set 1ong 1000 


另 一 方面 ， 如 果 一 列 的 文本 过 长 ， 可 以 用 SQL*Plus 的 Column 命 令 进 行 再 整 ， 为 了 在 本 次 
会 话 的 其 他 部 分 ， 视 图 名 view_name 能 够 在 20 列 中 显示 ， 键 人 如 下 命令 : 


coOTUMn view_ name format az0: 


要 了 解 有 关 ORACLE 数 据 宁 典 的 详细 信息 ,请 参 喧 推荐 读物 [10] 4 ORACLES Server 
Administrator's Guide 》( 《ORACLE8 上 服务 器 管理 员 指 南 》 )。 

(2) DB2 UDB 系 统 月 录 表 

DB2 UDB 产 是 有 很 多 日 录 表 ， 每 个 表 浆 有 很 多 列 。 用 户 可 以 用 SYSCAI 限 定 符 《这 是 一 
个 模式 名 ) 来 访问 这 些 表 ， 或 者 给 表 名 加 上 SYS 前 绥 并 使 用 8SYSIBM 限 定 符 。 下面 是 
SYSCATTABLES 或 同等 的 SYSIBM.SYSTABLES 中 的 一 些 列 。 


SYSCAT.TABLES (或 SYSIBM.SYSTABLES) 


me 


DB2 UDB 中 有 关于 表 的 和 目录 表 《 TABLES )、 美 于 表 内 列 的 目录 表 (COLUMNS )、 关 于 
视图 的 日 录 表 (VIEWS )， 还 有 关于 表 、 视 图 上 权限 的 目录 表 (TABAUTH )。 不 同类 型 的 约 
束 记 录 在 不 同 的 表 中 ， 例 如 ， 表 KEYCOLUSE 包 含 每 个 外 键 、 主 键 或 值 唯一 的 列 。 表 
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SYSCALCOLUMNS 中 的 列 如 下 。 
SYSCAT.COLUMNS (或 5YSIBM.SYSCOLUMNS) 


(其 他 列 ) 其 他 属性 : 空 值 ? 峡 省 值 ? 等 等 





例如 ， 要 列 出 由 Ponei 创 建 的 表 orders 中 的 所 有 列 ， 应 该 写 : 


seleEct colname from syscat.,colums 
where definer = "PONEIL. and tabname 一 “DRDERS 


要 了 解 有 关 DB2 UPB 系统 目录 的 详细 信息 ， 请 参阅 本 章 结 尾 处 的 “推荐 读物 ”[1] 列 出 的 
{A Compiete Guide to DB2 Universal Database 》) 《DB2 通用 数据 库 完 全 指南 》。 

(3) INFORMIX 系 统 目 录 

INFORMIX 中 有 关于 表 的 日 录 表 (SYSTABLES )、 关 于 表 内 列 的 目 这 表 
(SYSCOLUMNS )、 关 于 视图 的 目录 表 (SYSVIEWS )， 还 有 关于 表 和 视图 上 权限 的 是 录 并 
(SYSTABAUTH )。SYSREFERENCES 列 出 引用 约束 ，SYSCONSTRAINS 列 出 列 约束 。 
SYSDEPEND 列 出 表 和 和 视图 之 疗 的 依赖 关系 。 当 对 这 些 表 进 行 Select 时 ， 相 需要 限定 符 。 下 面 
是 SYSTABLES 中 的 一 些 列 。 

SYSCAT.TABLES 1 或 SYSBMTSY5TABLES) 















"T'=TABLE V'=VIEW 
表 SYSCOLUMINS 有 以 下 比较 重 昌 的 列 。 

INFORMIX SYSCOLUMNS 
aa 
0 = char, 1=smallint . . . ,19 = set, . .. ,4118 = 自 定义 的 行 类 型 


ET 


extended _ id 区 分 不 同 的 “ 自 定义 的 行 类 型 "(在 面向 对 象 的 NFORMIX 中 用 户 定 多 的 
类 型 ) ; eoltype 为 4118 是 表示 所 有 目 定义 类 型 的 通用 类 型 ， 面 每 个 目 年 多 的 类 型 都 是 孔 不 
相同 的 。 注 意 SYSCOLUMNS 和 SYSTABLES 中 都 有 列 tabiaq。 要 找 出 表 ordaers 的 所 有 列 的 
名 字 ， 我 们 可 以 通过 连接 tabia 的 语句 来 实现 。 


splect colname from syscolumns cc, systabtes 七 
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where cc.tabid = t.tabid and t.tabnrame = ‘orders'.: 

与 ORACLE 和 DB2 UDB 椒 同 ， 我 们 用 小 与 字母 表 杰 orSers， 因 为 INFORMIX 把 所 有 的 
名 字 都 变 成 小 写 的 ， 而 不 是 太 写 的 。 要 了 解 有 关 目 式 表 的 详细 信息 ,请 参阅 本 章 结 尾 处 的 
“推荐 读物 ”中 列 出 的 推荐 读物 [8] 《INFORMIX Guide to SOL》( 《INFORMIX SQL 指 南 》). 

3. 面向 对 象 的 目录 表 : ORACLE 和 INFORMIX 

当 用 户 在 数据 库 中 创建 用 户 定 疼 类 型 和 用 户 定 义 明 数 时 ， 不 光 要 记录 这 些 类 型 和 捕 数 的 
存在 ,还 要 记 录 它 们 的 相互 依赖 关系 ， 因 此 要 更 新 很 多 目录 表 。 在 使 用 UDT 和 UDF 时 ， 训 很 
快 会 发 现 ， 椒 理 这 些 依 赖 关 系 赴 非常 麻烦 的 。 如 果 用 户 定 的 类 型 入 中 用 到 努 一 个 用 户 定义 的 
类 型 B， 而 这 时 要 政变 B 的 定义 的 很 小 的 一 个 地 方 ， 则 不 得 不 去 除 太 原来 的 定 关 ,重新 定义 ，。 
事实 上 ， 不 光 是 类 型 A， 所 有 用 到 类 型 A 和 B 的 表格 等 都 要 作废 。 

有 - :种 简化 工作 的 办 法 是 建立 并 维护 一 个 SQL 程 夯 ， 来 去除 所 有 的 内 容 ， 然 后 从头 再 建 ， 
在 一 个 数据 库 系 统 中 ， 如 果 用 户 有 删除 和 建立 数据 库 的 权限 ， 就 不 必 费 力 地 -… 个 一 个 地 删除 ， 
可 以 直接 删 挤 整个 数据 闫 再 重 建 。 

即便 使 用 如 此 谨 忆 小 心 实现 的 程序 ， 还 有 可 能 发 现 某 个 地 方 的 类 型 没有 被 删 际 ， 因 为 有 
些 依 赖 关 系 设 有 被 发 现 。 这 菩 明 必须 参考 记 承 这 些 相互 依赖 关系 的 朋 针 表 . 

DRACLE 中 ， 日 录 表 给 出 了 每 个 对 象 类 型 的 项 层 朱 述 ,， 表 对 象 在 
USFER_OBJECT_TABLES (或 ALL 或 DBA_) 中 而 不 是 USER_TARLES 中 描述 。 所 素 的 是 ， 
我 们 要 考察 的 依赖 关系 都 在 大 USER_DEPENDENCIES 中 ,这些 表 中 最 重要 的 列 如 下 所 朱 、 


GRACLE USER_ YES 







| 


ET 
ET 







例如 ， 在 例 4.2.3 和 例 4.2.4 中 ， 我 们 建立 了 对 象 类 型 person_E， 它 的 属性 类 型 依赖 于 对 象 
类 型 name t+。 然后 ， 我 们 创建 广 表 people, 一 个 类 型 为 person_t 的 对 象 表 ， 因 此 它 依 更 于 
person_t ， 而 通过 person_t 叉 依 囊 于 name__t。 为 得 到 表 people 的 依赖 关系 ， 可 雇用 好 下 
语句 : 

select referetced name, referenced type From User_dependencies 

Where natme 一 ‘PEOPLE': 


输出 如 下 : 
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从 输出 我 们 可 以 看 到 ， 表 USER_DEPENDENCIES 甚 至 包含 了 表 peoplie 通 过 类 型 
Peracn 依赖 于 类 型 name_t 的 间接 依赖 关系 ， 它 还 指出 了 表 pecple 属 于 “标准 ” 包 ， 因 
为 用 户 没 有 为 它 建立 用 户 命 名 的 QRACLE 包 。 

闻 样 方式 的 查询 能 和 表 一 样 有 效 地 找 出 一 个 类 型 的 所 有 依赖 关系 。 因 为 汇集 类 型 也 是 全 名 
的 类 型 ， 它 和 们 也 适用 于 这 种 依赖 跟踪 系统 。 例 4.2.9 中 orqers 与 customers 的 REF 可 以 通过 
ORDERS 上 这 样 的 埋 询 找到 ; 要 把 REF 依 赖 与 HARD 依 赖 区 分 开 { 表 或 类 型 的 依赖 关系 )， 应 该 
在 查询 中 包括 列 dependency_type。( 参见 上 面 对 ORACLE USER_DEPENDENCIES 列 的 描述 。) 

INFORMIX 中 用 附加 表 来 记录 类 型 和 表 之 问 的 依赖 关系 ， 因 为 依赖 件 并 不 是 在 一 张 表 中 
的 。 而 且 ， 用 数值 标识 符 表 示 表 之 间 的 连接 列 ， 而 不 是 简单 地 使 用 字符 串 名 。 记 录用 广 定义 
类 型 的 顶层 表 是 SYSXTDTYPES。 我 们 需要 表 SYSCOLUMNS 和 SYSTABLES (本 节 前 面 介 绍 
过 ) 将 数值 标识 符 和 表 和 名、 列 名 及 其 类 型 匹配 。 最 后 ,我们 需要 表 SYSATTRTYPES 将 字段 类 
型 与 它们 封装 的 行 类 型 联系 起 来 。 下 面 是 记录 类 型 ( 行 类 型 和 汇集 类 型 )、 行 类 型 的 属性 、 汇 
集 类 型 的 元 素 类 型 的 目录 表 中 比较 重要 的 列 : 


INFORMIX SYSXTDTYPES 
name | 类 江 名 (如 襟 居 i 的 并， 
类 型 的 唯一 标识 符 


ye 与 coliype 类 位， 人 eehar …，19=sch 20=muitiset21=iist 22= 未 
[ybe 


命名 的 行 类 型 ，4118= 已 而 名 的 行当 型 
INFORMIX SYSATTRTYPES 


包含 该 字段 的 类 型 的 唯一 标识 符 



























字 朗 类 型 的 唯一 标识 符 





xtd_type_id 


要 列 出 所 有 类 型 表 及 其 类 型 ， 需 要 连接 表 SYSTABLES 和 SYSXTDTYPES， 并 匹配 表 类 型 
的 唯一 标识 符 ， 这 个 标识 符 在 SYSTABLES 中 称 为 type_xid， 在 SYSXTDTYPES 中 称 为 
extended_id。 这 里 ,我 们 将 列 出 表 people 的 表 类 型 : 


select t.tabname, typ.name from systables t, sysxtdtypes typ 
whers t.type_xtid = typ,.extended id and tabname = "peopler: 


下 面 我 们 举 - -个 与 ORACLE 相 同 的 和 例子 ， 找 出 与 例 4.2.4 中 的 表 people 有 依赖 关系 的 类 
型 。 刚 才 的 查询 将 会 浆 表 people 输 出 类 型 名 perscon_t。 要 找 出 被 表 pecple 使 用 的 行 类 型 
(或 列 类 型 )， 需 要 与 SYSCOLUMNS 做 进一步 的 连接 ， 见 习题 ?.20 中 的 讨论 。 然 而 ， 我 们 仍然 
会 沁 掉 询 类 型 的 属 福 的 属性 。 不 幸 的 是 ， 对 依赖 性 进行 完全 的 搜索 ,需要 根据 司 闵 链 ， 而 这 
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是 . -个 传递 闭 包 计算 。 传 递 闭 包 在 第 3 帝 的 3.11 节 讨论 过 。ORACLE 把 传递 闭 包 的 结果 放 在 自 
录 表 USER_DEPENDENCIES 中 ,从 而 为 用 户 解决 了 这 个 问题 。 


在 INFORMIX 中 ， 汇 集 类 型 没有 特定 的 类 型 名 ， 所 以 上 面 的 查询 将 输出 空 的 类 型 名 。 但 


它们 有 特定 的 扩展 标识 符 ， 因 此 数字 可 以 被 打印 输出 并 用 于 跟踪 该 类 型 。 
推荐 读物 


第 3 章 和 第 5 章 中 提 和 到 过 的 各 种 SQL 标准 和 SQL 产品 手册 仍然 是 很 有 用 的 ， 
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习题 


有 :标记 的 习题 在 书后 的 “习题 解答 ”中 给 出 了 答案 。 
在 下 面 的 习题 中 ， 如 没有 特别 说 明 ， 所 有 SQL 语 句 都 是 基本 SQL 形 式 , 者 不 存在 基本 SQL 
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形式 ， 可 胀 用 某 种 适当 产品 的 语法 。 

7.] (a 根据 例 7.1.2 中 customers 和 orders 的 定名 ， 写 出 带 有 完整 性 约束 的 创建 表 
agents 和 products 的 Create Table 语 句 。 注 意 ，Percent 应 在 0 和 10 之 间 ， 
cuantity 和 price 大 于 0 (假定 0 是 有 效 的 数据 类 型 的 形式 ). 

{b) 假定 DBA 要 求 customers 可 能 的 aiscnt 值 在 0.00 和 10.00 之 间 ， 而 及 数值 之 间 
的 差距 只 能 为 0.02， 所 以 可 接受 的 值 为 0.00 ，0.02，0.04，.…，9.96，9.98， 
10.00。 请 用 适当 的 Create Tabie 语 句 实现 这 样 的 约束 。 注 意 ， 因 为 可 能 的 值 很 多 ， 
所 以 用 CHECK 于 句 是 不 合适 的 ; 需要 另外 定义 一 个 表 来 实现 这 一 约束 。 

7.2 。 写 出 定 允 6.4 节 末尾 的 表 passengers, gates,， flights 和 和 seats 的 Create Table 

语句 。 使 表 正 确 地 反映 峡 6-14 中 实体 -联系 中 参与 三 的 基数 。 

7.3 。 将 图 6-11 中 实体 -联系 的 基数 补充 完整 ， 然 后 设计 关系 表 ， 最 后 与 出 能 正确 反映 你 

的 设计 的 Create Table 请 种。 

7.4 ”用 Create Table 语 名 中 提供 的 约束 ， 下 面 (a) 、(b)、{0) 三 种 情 沉 中 ， 蛙 一 种 可 以 正确 

表示 联系 中 实体 的 强制 参与 ? 

(ay* 当 实体 是 N-1 联 系 的 “1” 方 。 

(b) 当 实 体 是 N-1 联 系 的 “N” 方 。 

(c)。 当 实体 足 N-N 联 系 的 任何 方 。 

(dg) 使 用 参照 完整 人性， 可 凡 保 证 一 个 表 的 外 键 《 可 能 代表 一 个 联系 实例 ) 引用 为 一 
个 表 中 确实 存在 的 主键 (可 能 代表 实体 参与 了 那个 联系 ) 然而 ,参照 完整 性 本 
能 保证 实体 在 联系 中 强制 参与 。 你 能 否 研 述 一 种 . 假 急 的 ) 完整 性 来 实现 这 种 
约束 ? 

7.5 (a) 根据 X/Open 中 更 新 视图 的 约束 ,下面 哪 一 条 SQL 讲 句 是 合法 的 ? 《括号 中 说 明 

了 视图 是 在 哪个 例子 中 创建 的 ,) 
{jy update agentorders set month = Jun ; (全 7.2.1) 
Di} update acorders set month = ‘jun’ where pid = 'cO01°;( 例 7.2.5) 
(ily update agentsales set aid = ‘axx’ Where aid= "a03'; {和 例 7.2.7) 


(bj* 假定 我 们 没有 在 习题 7,1 的 (的 中 的 Create Table 语 句 中 用 完整 性 约 东 来 限制 如 
percent 的 值 。 在 天 agents 上 建立 一 个 可 更 新 的 钢 图 agentview， 并 防止 
任何 更 新 agentview 的 用 户 ,， 将 percent 变 成 小 于 0 或 大 于 10 的 值 . 

{ce) 同样 假定 我 们 没有 对 表 agents 的 列 percent 用 完整 性 约束 进行 限制 在 
ORACLE,DB2 UDB 和 INFORMIX 中 都 可 以 为 表 加 上 完整 性 约束 而 无 须 重 建 表 。 
给 出 某 些 特定 产品 中 的 相应 命令 。 

{d) "我 们 希望 用 两 个 语句 来 授予 用 广 Beowulf 一 些 权 限 ， 使 他 能 够 访问 表 products 
的 pid， Pname, Cj ty 和 Rauwantity (不 是 price)】 列 ， 并 了 且 能 更 新 city 和 
quant 列 《但 不 能 更 新 其 他 刻 )。 写 出 实现 这 些 功 能 的 语句 。 

7.6 ”判断 下 面 的 说 法 正确 与 否 ， 并 给 出 说 明 。 最 好 引用 本 文 的 内 容 (年 义 、 例 了 于、 图 或 
某 一 页 的 讨论 ) 来 支持 你 的 观点 。 
(a} 表 的 某 行 中 允许 有 构成 主键 的 列 中 有 -~-- 个 为 空 。 半 还 是 第 ? 
{bh) 表 的 某 行 中 允许 有 构成 外 键 的 列 中 有 一 个 为 空 。 对 还 是 针 ” 
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(c)。 在 基本 SQL 的 Create Table 语 法 中 ， 可 以 用 包含 特定 子 查询 的 CHECK 子 句 实 更 
FOREIGN KEY ... REFERENCES 约 束 。 对 还 是 错 ? 
(d) 尽管 基本 SQL 中 可 以 用 约束 来 定义 主键 但 不 能 定义 表 的 其 他 候选 键 。 对 还 是 错 ? 
7.7 ”所 有 的 数据 库 产 品 都 允许 DBA 在 完整 性 约束 中 指定 -~ 些 供 选 择 的 动作 ， 当 从 - -个 表 
中 删 去 一 行 ， 而 该 行 的 主键 值 可 能 止 被 男 一 个 表 作 为 外 键 引 用 时 ， 采 用 这 些 动 作 .， 其 中 的 一 
种 产品 有 多 种 可 能 的 动作 。 
{a)e 给 出 所 有 产品 和 某 个 特定 产品 中 可 能 的 动作 名 。 
{b) 给 出 SQL 产品 中 缺 省 执行 的 动作 名 。 
(c) 参照 图 2-2 中 CAP 数 据 库 的 内 容 ， 说 说 如 果 删 除 顾 客 c001， 而 (b) 中 州 出 的 动作 起 
作用 ， 会 发 生 什 么 结果 . 
7.8 ”假定 表 customers 以 例 7.1.2 的 形式 定义 我们 想 创 建 customers 的 精确 出 本 
customers]， 包括 customers 的 所 有 行 和 约束 。 
(3)* 写 出 在 QRACLE 中 创建 customersl 的 请 司 ，customers1 型 和 包括 
customers 的 所 有 行 。 要求 用 一 条 语句 完成 。 
(b) 在 基本 SQL 中 用 两 条 语句 完成 同样 的 任务 【不 用 AS 子 查 阐 子 可 小 
{c) * 说 明 为 什么 在 ORACLE 中 执行 和 下面 的 Create Table 语 句 时 会 出 错 ， 并 改正 错 旋 。 
create table customersltrid primary key, chame,. city. 
discent check tdiscent <~ 15.0} 


站 号 Select c.* from CuStomers Cc, Orders o Where ccid = o.cid 
and o.qty > 1000; 


7.9 假定 有 一 个 表 armmplLoyees， 它 有 =ia，ename 和 mgrioa 列 ， 还 有 机 个 到 sa1ary1l 
和 salary2 为 浮 点 数 分 别 表 示 两 种 不 同 的 工资 ( 可 能 是 对 不 同 的 工作 项 日 )。 注 意 ， 在 SQL 
中 ，FLOAT 是 POUBLE PRECISION 的 另外 一 个 名 字 。 现 在 假定 用 Create View 语 名 创建 一 个 
视 几 emPs: 
create view emps (eid, ename., mgrid, totsaly 8s 
splect eid, ename, mgrid, salaryl + Sa1ary2 from employees: 
这 是 一 个 不 可 更 新 的 视图 。 它 违反 了 什么 规则 ?给 出 一 个 对 视图 emps 进 行 更 新 的 例子 ， 
而 这 种 更 新 很 难 转化 成 对 基本 表 emp1oyees 的 修改 ( 即 不 清楚 应 该 对 基本 肯 employecs 进 
行 什 么 样 的 修改 )， 由 此 说 明 这 条 规则 存在 的 道理 。 
7.10 “[ 难 ] 例 7.2.6 旺 示 了 一 个 视图 colocated， 当 我 们 要 删除 一 行 或 修改 一 列 时 ， 两 个 
表 customers 和 agents 的 city 列 连接 将 会 引起 无 法 预料 的 后 果 。 如 果 我 们 通过 连接 表 
agents 和 orders 的 aia 列 定义 视图 agentords 《外 键 与 主键 的 自然 连接 ), 忒 会 出 现 证 必 
情况 呢 ? 考虑 到 要 对 得 到 的 视图 进行 更 新 、 珊 除 和 插入， 我 们 想 允 许 对 这 种 自然 视图 进行 的 
更 新 。 说 明 当 对 视图 进行 这 些 操 作 时 ， 基 本 表 会 发 生 什 么 变化 。 注 意 ， 各 人 的 想法 叮 能 有 些 
不 同 。 
(aj* 插入 操作 中 ， 如 果 揪 人 的 是 一 个 新 的 aid 值 会 怎样 ?9 如果 揪 入 的 是 一 个 已 经 存 
在 的 aia 值 但 aname 值 不 相同 又 会 怎样 ? (根据 函数 依赖 ， 你 认为 会 发 全 所 样 
的 情况 ? ) 
{b) 应 该 如 何 处 理 删除 操作 ? 
[ce) 更 新 操作 中 ， 分 别 考 虚 表 agents 和 表 orders 中 的 不 是 键 的 那些 列 和 是 键 的 列 
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ordno, aid, cid 和 pid。 
上 机 作业 为 下 面 的 习题 中 编号 过 程 或 程序 。 
7.11 关于 触发 器 的 练习 。 

(a) 创建 一 个 叫做 agent_city 的 制 发 器 ， 保 证 新 插入 表 agents 的 行 的 城市 值 必须 
是 表 customers 中 的 城市 之 一 。 注 意 ， 为 了 3| 用 新 搬入 的 agent_city， 触发 
器 必须 被 定义 为 AFTER INSERT 的 。 尽 管 是 在 行 搬入 后 对 表 进行 检查 的 ， 如 宁 
被 解 发 的 触发 融 调 用 ORACLE 的 raise_application_error 或 DB2 UDB 的 信号 范 数 ， 
插入 将 和 失败。 对 和 你 的 触发 器 进行 测试 一 一 如 巡 它 是 正确 的 ,可 以 使 插入 内 波 ， 如 
果 不 正确 则 不 能 一 一 尝试 两 种 不 同 的 Insert 语 句 。 

(b) 创建 一 个 触发 器 ， 当 向 表 orqers 中 插入 一 个 新 订单 时 被 触发 ， 自 动 地 更 新 表 
products 的 quantity 列 。 触 发 器 必须 把 在 orders 中 指定 的 qty 从 
products 相 应 行 的 quantity 中 减 去 。 

(c) 假定 韭 过 程 性 约束 将 导致 插入 一 行 的 失败 。 在 这 种 情况 下 ，BEFORE INSERT 人 能 
发 器 可 以 舱 发 吗 ? 设计 一 个 简单 的 实验 来 证 明 你 的 结论 ，: 

7.12 ”在 你 班 连接 到 CAP 的 数据 库 系统 的 交互 式 临 视 器 中 ， 用 - -个 命令 列 出 所 有 的 视图 。 
这 可 能 需要 查询 系统 自 录 。 先 在 表 cus tomers 的 基础 上 定义 视图 custview， 选 站 discnt 
<]2 .0 的 行 ， 然 后 在 视图 定 儿 中 加 上 with check optieon 子 杀 。 再 放出 所 有 视图 ， 看 看 
custview 有 没有 加 进来 。 执 行 Select 语 句 select * from custview。 下 向 试 着 修 攻 
custview， 使 customers 中 cig 等 于 e001 的 行 的 4iscnt 秆 等 于 13.0。 可 以 进行 修改 吗 ? 
执行 select * from customers 语 句 ， 可 以 看 到 修改 没有 成 凡 。 现 在 不 写 with check 
option 子 句 ， 重 新 定义 视图 custview (需要 先 删 掉 原来 那个 )， 再 做 一 次 更 新 。 可 以 看 到 
这 次 成 荔 了 。 暂 时 让 表 cusgtomers 处 于 被 修改 状态 。 

7.13 如 果 你 正在 使 用 DRACLE 数 据 库 系统 ， 请 在 连接 视图 上 做 以 下 习题 。 

{a) 首先 要 确定 你 的 所 有 CAP 表 格 中 者 定义 了 主键 。 然 后 创建 -个 视图 brcaoras， 
选 出 prcductes 和 orderg 的 连接 表 中 的 所 有 列 ， 子 查询 中 只 对 pid-- 个 列 给 出 
别名 ppid。 接 下 来 执行 语句 
select column_name, updatable from user_ updatable colwutnns 

Where table name = PRODDRDS': 


修改 一 个 查询 结果 中 UPD 列 为 YES 的 视图 ， 并 检查 更 新 是 否 会 影响 基本 表 ， 以 确定 
和 你 是 否 可 以 更 新 这 些 视图 。 间 样 ， 检 验 一 下 ，UPD 为 NO 的 视图 是 否 不 能 袜 轩 新 。 

(b) 对 例 7.2.6 的 视图 colocated 重 复 (a) 中 的 步 又 。 

(ce] 对 视图 apords 重 复 (ia) 中 的 步骤 。apords 通 过 对 替 agents、products 和 
orders 的 连接 得 到 ， 只 保留 一 个 ai d 到 和 一 个 pia 列 ， 将 它们 分 别 重 命名 为 
aaid 和 ppid， 将 a .city 和 gp .city 分 别 重 命名 为 acity 和 pcity。 然 后 重复 
(2) 中 的 步 又 。 

td) 删除 表 prodqucts， 再 重建 一 个 没有 主键 的 表 products (其 要 求 对 列 piad 使 用 
not null unique ) ;然后 重新 装 作 表格。 再 对 products 重 复 (a) 中 的 步 又 。 

当 完 成 了 这 一 习题 后 ， 重 新 装 人 所 有 修改 过 的 CAP 表 。 
7.14。 在 你 的 SQL 监视 器 中 ， 用 一 条 命令 列 出 所 有 完整 性 约 柬 。 可 能 需 蓝 查询 系统 目录 。 
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接 上 一 习题 ， 我 们 假定 cia 等 于 ce001 的 行 的 daiscnt 值 等 开 13.0。 在 表 customers 上 建立 一 
个 完整 性 约束 〔 如 果 你 的 系统 支持 命名 的 约束 ， 请 给 出 命名 的 约束 )， 要 求 discnt<=12.0。 
这 样 能 行凶 ? 会 出 现 什 么 情况 ?修改 表 cus tomers， 使 cigd 等 Fc001 的 行 的 4iscnt 值 为 
10.0， 再 尝试 建立 完整 性 约束 。 接 下 来 修改 customers， 使 cid 等 于 c001 的 行 的 4ijscnt 值 
为 16.0。 这 样 的 修改 可 以 实 班 哆 ? 通过 执行 select * from customners 说 明 收 改 没 有 成 
功 。 现 在 去 掉 约 束 ， 再 进行 收 改 ， 可 以 看 到 这 次 修改 成 功 了 。 最 后 ， 将 表 customers 回 复原 
值 并 重新 装 人 。 
7.15 (aj* 在 表 orders 中 搬入 一 行 ， 1031，jul，c001，a01，p01，1000，450.00。 基 于 
表 orders 上 建立 一 个 视图 returns， 包 含 列 ordno, month, cid, aid, 
pid,， qty，dollars 以 及 discnt (来 自 表 customers)，percent (来 自 
表 agents ) 和 price (来 自 表 products )。 用 SQL 请 句 查 询 相 应 的 目录 表 ， 
以 确认 视图 returns 确 实 存 在 。 同 时 确定 各 列 的 名 称 。 
(by 执行 语句 select ordno, gtvy, dollars, discnt, percent, 
price from returns where cid = 'c001'。 然后 将 基本 表 
customers 中 e001 的 aiscnt 值 改 为 13.0， 再 对 returns 执 行 Select 语 可。 可 
以 看 到 ， 对 基本 表 的 修改 在 视图 中 反映 出 来 了 了。 最 后 ， 将 c001 的 aiscnt 值 回 
复 为 10.0 (或 直接 蛋 新 六 入 customers )。 
(ce) "注意 ， 表 returns 中 的 列 dacollars 应 该 等 于 gty 乘 以 price 再 减 去 该 金额 的 
discnt 值 。 测试 一 下 你 的 能 力 ， 选 择 视 图 returns 中 所 有 行 的 ordno，qty， 
dollarsgs, 9iscnt,，percent 和 price， 并 在 此 基础 上 写 表达 式 ， 用 Select 语 
名 中 的 一 个 附加 列 来 计算 表达 式 的 值 。 这 个 附加 列 的 值 应 该 与 46o11ars 相 等 。 
(d) 在 视图 returns 的 基础 上 建立 一 个 新 的 视图 profits， 包 括 列 ordno，cigd， 
aid， pid 和 profit， 其 中 profit 列 已 经 在 Create View 诸 句 中 计算 过 ， 等 于 
sty 乘 以 相应 pia 的 price， 若 为 批发 ， 应 减 去 该 值 的 60 和 ， 再 减 去 给 某 个 特 
定 代 理 商 的 percent 和 对 当前 顾客 的 daiscnt。 确保 表达 式 的 正确 人 性 。 执 行 
select * from profits，, 看 看 结果 如 何 ， 

7.16 在 班级 内 指定 一 个 同伴 ， 与 你 的 同伴 相互 交换 “权限 ”。 授 予 你 问 伴 的 数据 库 账 号 
完成 选取 (只 能 选取 ) 表 customers 中 discnt <10 的 行 的 权限 。 需要 建立 一 个 视图 ， 取 名 
为 custview， 来 达到 这 个 目的 。 使 用 相应 的 命令 来 显示 视图 和 权限 的 存在 。 保 持 授 权 的 有 
效 性 ， 演 示 你 如 何 访问 同伴 的 数据 库 。! 你 需要 先 登 录 数 据 库 ， 骨 执行 语句 select * Erenm 
CUStVviewo, ) 

?7.17 说明 如 何 通过 系统 目录 表 检 索 你 的 数据 库 中 所 有 的 视图 名 上 友基 本 表 名 。 从 视图 
returns 检 索 所 有 的 列 名 。 能 通过 目录 检索 出 视图 returns 的 定义 呵 ? 

7.18 编 气 - :个 髓 入 式 SQL 程 序 修改 customers， 将 cid 为 c001 的 行 的 discnt 值 加 1。 
在 程序 中 包括 检查 是 否 没 有 行 被 收 改 而 且 给 出 了 用 户 警 告 的 测试 。 在 customers 上 设置 个 
约 吕 ， 使 discnt <= 15.0， 肯 执行 程序 直到 出 现 警告 。 

7.19 ”在 7.1 节 的 最 后 一 小 节 中 ， 本 文 建议 开发 一 个 具有 程序 功能 的 蚜 数 层 来 执行 所 有 的 
数据 库 更 新 操作 。 层 本 身 要 保证 必要 的 约束 ， 述 要 完成 其 他 功能 ， 如 在 约束 被 打破 时 执行 供 
选择 的 动作 。 为 解决 这 个 问题 ， 需 要 建立 一 个 新 表 or 4s ， 它 包括 表 orders 的 所 有 列 ， 数 据 
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类 型 也 相同 ， 但 不 包括 brders 的 芍 率 ， 甚 至 下 要求 ordnoc 为 NOT NULL 的 。 表 crdag 还 另外 
有 一 列 ， 称 为 constrok， 为 integer 类 型 。 下面 编写 一 个 CC 歇 数 insertords()}， 其 声明 如 下 
int insertordstint *ordnop,. char *monthp, char *cidp. 
char *aitdp, char *pidi, int *qtyp. double * dollarsp): 

阁 程 序 要 往 表 ords 中 插入 一 行 。 就 必须 调用 insertords， 并 有 几 指 针 指向 要 插入 的 各 相 
应 列 的 什 。 空 指针 表明 没有 指定 值 并 搬入 一 个 空 值 。 函 数 1nsertords 必 须 对 例 7.1.2 中 给 出 
的 表 oraers 的 所 有 11 种 约束 进行 调试 。 如 果 欲 插入 的 行 通过 了 测试 ， 拓 数 可 以 将 它 揪 人 到 
ords 中 ， 并 置 conskrok 列 值 为 1， 返 回 0。 如 昌 有 和 什 何 约束 不 满足 ， 熙 数 将 给 用 户 提 示 信 息 
{ 如 “Error: null ordno, continue? Enter Y or N”)。 如 果 用 户 给 出 了 YY 和 和 N 之 外 的 巷 案 ， 回 最 示 
“Y¥ or N, Please” 人 信息， 提示 用 户 重 新 输入 。 旭 果 刍 和信 N， 力 数 insertords 不 播 人 该 行 ， 并 返 四 
- 1。 如 果 键 入 Y， 国 数 insertords 将 该 行 照 原样 (诸如 不 满足 约束 等 ) 插入 ， 置 标志 
constrok 为 0， 并 返回 1。 教 师 将 提供 一 个 驱动 程序 ariveord.c 来 测试 这 个 国 数 ， 并 给 出 
张 动 程序 的 输入 。 注 意 ， 这 种 方法 并 不 是 要 取代 约束 ， 只 是 要 比较 -下 两 者 的 方便 性 ， 同 时 
说 明 如 有 果 数 据 库 产 由 不 文 持 你 需 机 的 约 康 时 该 怎么 办 。 

7.20，( 徊 问 对 和 象 的 [INFORMIX ) 与 一 个 对 目录 表 SYSTABLES，SYSCOLUMNS 和 和 
SYSXTDTYPES 的 查询 ， 找 出 被 例 4.2.4 的 表 Peop1Le 用 作 列 类 型 的 行 类 型 。 这 个 查询 将 找到 
rame + 上 ， 国 为 它 被 用 机 了 了 蜀 类 型 ， 而 pergson tt 则 不 是 ， 它 是 束 个 行 的 类 型 【已 经 在 本 文 的 
查 阐 中 找到 ) 当然 ， 我 们 可 以 把 这 两 种 查询 UNION 起 来 。 但 这样 还 是 不 能 找到 一 个 为 行 类 型 
列 的 属性 的 类 型 。 为 了 把 这 些 也 找 出 来 ， 写 -- 个 同时 还 使 用 表 SYSATTRTYPBES 的 查询 ( 总 共 
用 4 个 表 )。 


TT E] 
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当 一 个 SQL 查询 所 区 给 数据 库 系 统 的 时 候 ， 一 个 称 为 查询 优化 器 的 软件 模块 将 对 查询 中 
的 非 过 程 命令 进行 分 析 ， 然 后 决定 一 个 能 一 步 一 步 地 访问 到 所 需 数据 的 步骤 。 这 种 执行 查询 
的 步骤 被 人 们 称 为 访问 计划 或 者 查询 计划 。 在 第 9 章 中 ， 我 们 将 详细 讨论 查询 优化 器 是 怎么 制 
定 出 访问 计划 的 ; 在 本 章 中 ， 我 们 通过 阐述 查询 如 何 利 用 数据 库 索 引 来 提高 访问 表 中 数据 的 
效率 来 况 定 … 个 基础 。 


8.1 索引 的 概念 


数据 库 索 引 ， 简称 为 索引 ， 与 读者 以 前 学 当 这 的 驻 留 内 存 的 数据 结构 有 些 类 似 。 它 的 日 
的 是 提高 对 表 中 行 的 数据 查找 的 效率 。 在 学 习 本 章 前 ， 我 们 和 假设 读者 对 支持 这 类 查找 的 驻 留 
内 存 的 数据 结构 已 经 是 非常 熟悉 的 了 ， 这 些 数据 结构 包括 二 丸 树 、2-3 树 和 散 列 表 ( 有 很 多 书 
本 都 包括 这 些 数据 结构 的 讨论 ， 参 由本 章 末 尾 的 “推荐 读物 ”)。 数 据 库 索引 区 别 于 蛙 留 内 存 
的 数据 续 构 的 地 方 在 于 ， 数 据 库 索 引 包 含 的 数据 量 比 一 次 能 调 人 内 存 的 数据 其 大 。 因 此 , 数 
据 库 索 引 的 数据 是 存放 在 磁盘 上 的 ， 只 有 被 访问 的 时 候 才 会 被 部 分 地 调 人 人 内存。 这 样 敌 的 另 
外 “个 优点 是 ， 当 计算 机 关闭 的 时 候 ， 驻 留 内 存 的 数据 将 琶 失 ， 但 是 数据 库 索 引 中 的 数据 像 
表 中 的 记录 一 样 会 永久 存在 。 

索引 是 由 一 系列 存储 在 磁盘 上 的 索引 项 组 成 。-- 个 索引 项 对 应 于 圭 引 中 的 一 行 ， 当 行 发 
生 更 新 的 时 候 ， 索 引 也 将 做 出 响应 。 这 意味 着 如 果 一 个 行 按 某 … 庆 中 的 值 访 问 ， 索 引 将 提供 
这 种 访问 ; 如 果 行 中 该 列 的 值 被 收 改 了 了， 索引 也 将 做 相应 的 变化 ， 索 引 项 有 点 儿 像 一 个 由 两 
列 组 成 的 表 ; 第 一 列 是 索引 键 ， 由 行 中 某 些 列 (通常 是 一 列 ) 中 的 值 串 接 而 成 ; 第 二 列 尾 行 
指针 ， 措 向 行 所 在 的 磁 盐 位 置 。 索 引 项 存储 磁盘 上 上， 通常 是 按照 察 引 键 排序 的 (尽管 布 的 时 
候 可 能 是 按 散 列 访问 )， 这 样 就 可 以 提 商 特定 的 SELECT 语句 的 查询 速度 。 则 型 的 通过 索引 查 
询 是 给 定 一 个 键 值 或 者 键 值 的 范围 ， 找 到 索引 项 ， 然 后 根据 行 指针 找到 相应 的 行 。 数 据 库 索 
引 通 常 是 存放 在 磁盘 上 的 ， 和 但 是 和 访问 内 存 相 比 ， 和 磁盘 访问 是 相当 慢 的 ， 这 个 事实 对 于 我 们 
将 要 学 习 的 数据 库 索引 结构 ( 例如 B 树 ) 有 重要 影响 。 数 据 库 索引 设计 的 最 重要 的 目标 就 是 中 
减少 读数 据 所 需 的 磁盘 访问 的 次 数 。 

读者 可 以 把 数据 库 的 索引 设想 成 图 书馆 中 旧式 的 目录 卡片 ， 这 些 目录 卡 放 对 书架 上 的 书 
目 按 类 别 做 了 索引 。 日 录 册 中 的 一 些 卡 片 是 按 作 者 的 字母 恬 序 放置 的 ， 男 外 一 些 是 按 标 题 排 
序 的 ， 还 有 一 些 是 按 主 题名 排序 的 。 生 录 册 中 的 每 一 张 卡 片 都 记录 了 该 -上 内 的 书架 号 码 ， 所 以 
-~ 旦 读者 找到 了 《The Three Laws of Roborics》 一 书 的 目录 项 ， 就 可 以 立刻 在 书架 上 找到 这 本 
书 。 现 在， 我 们 青 返回 到 关于 索引 的 讨论 中 来 ， 让 我 们 看 看 处 理 下 列 SQL 查 询 的 时 候 ， 数 据 
库 系 统 都 懒 了 些 什 么 。 


[8.4.1 select * from customers where city = ‘Boston’ 
and discnt between lz and 14: 


查询 优化 器 将 要 决定 怎样 从 customers 表 中 访问 到 上 述 查 询 需 要 的 行 。 一 个 可 选择 的 方 
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法 是 执行 一 次 表 扫 描 ， 将 对 表 中 所 有 行进 行 连续 访问 ， 把 那些 不 满足 wHERE 子 句 中 的 两 个 
And 的 谓词 的 行 贡 除 。( 在 这 种 方法 中 ， 我 们 是 直接 检查 行 中 数据 的 。) 如果 customers 表 中 
的 行 数 小 于 10( 如 图 2-2 所 本 )， 和 那么 打 描 整 张 表 可 能 是 最 好 的 策略 ; 如 果 表 中 的 行 数 不 大 的 
语 ， 直 接 检 查 所 有 行将 是 非常 快速 的 。 类 似 地 ， 如 果 书 架 上 的 书 只 有 不 到 10 本 ， 那 么 在 目录 
卡片 中 得 启 书 并 不 比 直 接 查询 有 效 。 但 是 ， 如 果 表 中 有 一 百 万 行 ， 通 过 索引 结构 来 查 淘 记录 
将 是 非常 有 效 的 。 

如 果 对 一 个 有 太 量 记录 的 customers 表 执行 [8.1.1] 中 的 查询 ， 而 customers 表 中 
aiscnt 属 性 又 设 有 索引 ， 只 有 citcy 属 性 上 有 索引 ， 上 正确 的 查询 过 程 是 什么 呢 ? 在 这 种 情况 
下 ， 间 先 系 统 将 记 定 需要 查询 在 Boston 的 顾客 ， 然 后 通过 上 和 面 讲述 的 行 指针 来 访问 所 有 在 
Boston 的 顾客 。 将 查询 限制 在 Boston 中 ， 将 大 大 闫 上 少 访问 的 行 数 。 然 后 我 们 只 要 在 挑选 出 的 
Boston 的 顾客 中 ， 选 出 discnt 属 性 又 在 12 至 14 之 间 的 记录 就 可 以 了 。 

最 终 用 户 或 者 提出 查询 的 程序 员 不 需 旨 知道 提高 访问 速度 索引 的 存在 。 当 一 个 应 用 程序 
执行 [8.1.1] 中 的 查询 的 时 候 ， 查询 优化 器 将 根据 各 个 因素 (例如 是 否 有 索引 存在 ) 来 决定 如 
何 满足 该 要 求 ， 它 可 能 和 最 初 的 查询 已 经 有 了 很 大 的 变化 。 事 实 上 ， 关 系 模型 的 一 个 重要 特 
征 就 是 程序 员 可 以 不 管 索引 结构 是 耕 存 在 ， 而 编写 出 不 依 束 于 特定 索引 的 程序 ( 因为 总 是 可 
以 使 用 扫描 表 的 方法 )。 这 也 是 第 1 章 中 定义 1.3.1 讲 述 过 的 程序 -数据 独立 性 的 一 个 方面 。 在 这 
种 情况 下 ， 数 据 库 管理 员 人 负责 创建 和 删除 索 引 。 但 是 ， 这 只 是 理论 上 的 情况 。 在 实际 情 沈 下 ， 
用 户 是 可 以 注意 到 使 用 正确 索引 后 执行 某 个 查询 只 需要 2 秒 钟 而 不 使 用 索引 时 执行 该 查询 需要 
两 分 钟 之 间 的 差别 的 。 如 果 资 源 消耗 严重 影响 到 系统 的 总 性 能 ， 可 能 就 需要 删除 这 些 索 引 结 
构 了 了 。 

在 考虑 索引 的 很 多 方面 的 时 候 ， 我 们 将 进入 SQL 标 准 很 少 涉及 的 内 容 。 为 了 能 更 好 地 说 
明 ， 图 8-1 给 出 了 X/Open 标准 的 SQL 硬 人 句 。 


CREATE LUNIGUE] 了 INDEX jindexname 
ON tablename tcolumrname [ASC | DESCT (, columnname [ASC |DESC1}}): 


图 8-1 Create Index 语 句 的 语法 


Create Index 语 法 中 的 表 名 必须 是 发 出 该 语句 时 已 经 存在 了 的 基本 表 ， 指 定 的 列 名 必须 是 
没有 被 限定 的 。 图 8-1 中 的 语句 将 在 磁盘 上 创建 一 系列 的 索引 项 ， 一 条 索引 项 对 应 于 表 中 的 一 
行 。 上 面 我们 已 经 讲 过 ， 索 引 项 类 似 于 一 个 含有 两 列 的 表 : 一 个 是 索引 键 ， 由 Create Index 语 
名 中 指定 的 殉 的 值 串 接 组 成 ; 另外 一 个 是 指 癌 磁 盘 位 置 的 指针 。 当 指定 了 UNIQUR 子 铝 后 ， 
索引 中 存放 的 索引 键 值 必须 是 唯一 的 ， 除 非 有 一 个 串 接 到 键 值 的 列 是 空 值 : 在 这 种 情况 下 重 
复 索引 键 值 是 允许 的 。 索 引 项 将 按 索 引 键 值 的 顺序 存放 在 磁盘 上 的 (在 标准 SQL 中 ， 散 列 访问 
是 不 被 支持 的 )， 索 引 键 值 的 顺序 可 以 是 和 开 序 ， 也 可 以 是 降序 ， 像 SELECT 请 名 中 的 DRDER 
BY 子 名 一样。 对 于 给 定 的 键 值 或 者 键 什 的 范围 ， 系 统 将 在 索引 中 找到 相应 的 索引 项 ， 然 后 根 
据 行 指针 找到 相应 的 行 。 值 得 注意 的 是 ， 当 执行 完 Create Index 语 句 后 ， 索 引 中 的 内 容 将 自动 
随 表 中 内 容 的 变化 而 变化 。 如 果 表 中 搬入 了 一 行 ， 索引 中 也 会 创建 一 条 新 的 索引 项 ， 然 后 把 
该 索引 项 放 在 索引 结构 中 正确 的 位 置 上 。 类 似 地 ， 加 采 行 中 索引 键 的 值 发 生 了 变化 ， 索 引 项 
也 会 发 生变 化 : 旧 的 索引 项 将 会 被 删除 ， 然 后 在 正确 的 位 置 插入 一 条 新 的 案 5 引 项 。 


例 8.1.1 对 customers 表 的 city 列 创建 索引 : 
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credte index citiesx on customers (city): 


值得 注意 的 是 ，citiesx 索 引 中 的 每 一 个 索引 键 值 (例如 city 和 名) 都 对 应 于 
customers 表 中 的 很 多 行 。 索 引 创建 后 ， 如 果 需 要 删除 索 351 (citiesx)， 丁 以 用 下 向 的 标 
准 SQL 营 三 : 

drop index citiesx: 图 

值得 注意 的 是 ， 索 引 键 这 个 术语 和 表 键 的 关系 概念 〔 主键 和 候选 键 ) 之 问 有 不 同 的 售 尽 。 
索引 键 是 根据 一 些 列 按 特定 的 顺序 创建 的 ， 而 关系 键 中 列 是 没有 顺序 的 。 另 外 更 基本 的 是 ， 
索引 键 是 为 了 能 更 有 效 地 查找 数据 ， 如 时 Create Index 语 名 中 不 使 用 UNIQUE 子 句 ， 那 么 同一 
个 索引 键 值 可 以 对 应 于 表 中 的 多 个 行 。 在 例子 8.1.1 中 ， 我 们 就 看 到 了 这 样 的 重复 的 索引 键 值 。 
另 一 方面 ， 关 系 键 并 不 和 提高 查找 效率 有 关 ， 键 ( 主键 或 者 候选 键 ) 是 通过 Create Table 语 名 
创建 的 ,可 以 使 用 NOT NULL、UNIQUE 或 者 PRIMARY KEY 子 名 。 但 它 只 是 反映 了 对 于 每 
一 行 都 应 该 存在 一 个 单一 的 键 值 。 如 果 有 可 能 引起 理解 混乱 的 话 ， 我 们 将 使 用 术语 : 索引 键 
和 表 键 (或 者 其 他 表示 表 刍 的 术语 ， 例 如 主键 和 民 选 键 ) 来 区 别 这 两 青 。 

当然 也 可 以 在 表 的 某 些 列 上 使 用 唯 -- 索 引 ， 以 达到 完成 唯一 人 性 约束 的 日 的 。 当 UNIQUBE 
和 PRIMARY KEY 成 为 Create Table 语 名 的 标准 组 成 部 分 前 ， 在 一 些 数据 库 产 品 中 ， 就 是 使 用 
唯一 索引 来 保证 后 选 键 的 唯一 性 约束 。 在 唯一 索引 中 仍然 可 能 出 现 空 值 ， 但 是 可 以 对 候选 键 
中 所 有 的 列 包括 NOT NULL， 就 像 现 在 Create Table 语 苛 中 使 用 了 UNIQUE 约 束 一 样 。 


例 8.1.2 ”假设 我 们 没有 声明 customers 表 中 的 cid 列 是 UNIQUE 或 者 PRIMARY KEY。 
可 以 创建 一 个 索引 保证 每 一 行 都 有 唯一 的 cia 值 。 

Create dNnigue index eid on customers {elds 

当 索 引 ciax 第 一 次 创建 的 时 候 ， 系 统 将 测试 custcmers 表 中 是 否 存 在 重复 的 ciq 值 ， 如 所 
存在 重复 值 ( 重复 的 空 值 除外 )， 那 么 索引 将 不 会 被 创建 。 索 引 创 建 完 毕 之 后 ， 对 该 表 的 所 有 的 
更 新 操作 将 会 对 该 索引 产生 影响 。 任 何 可 能 造成 重复 索引 键 值 的 条 人 或 者 更 新 操作 帮会 被 拒绝 
执行 。 ||! 

现在 有 了 Create Table UNIQUE 和 PRIMARY KEY 两 种 约束 ， 使 用 这 了 酚 种 约束 比 使 用 通过 
索引 的 唯一 性 约束 让 好 : 查询 优化 器 可 以 利用 这 一 点 ， 特 别 是 当知 道 琢 的 主键 是 什么 的 时 候 : 
但 是 ， 这 些 Create Table 的 唯一 性 约束 通常 是 通过 一 个 由 系统 创建 的 唯一 索引 完成 的 ， 因 为 播 
入 新 的 记录 或 者 影响 索引 键 值 的 更 新 操作 都 需要 快速 的 查找 操作 。 

图 8-1 中 的 Create Index 语 句 的 X/Open 标准 ， 和 一 些 主 要 的 数据 库 系统 产品 的 Create Index 
语句 相 比 要 简单 得 多 。 但 是 即使 如 此 ， 它 仍然 不 被 SQL-99 标 准 支持 。Create Index 没 有 标准 的 
原因 有 是， 索引 策略 需要 考虑 数据 库 系 统 的 内 部 体系 结构 ， 包 括 显 式 地 设计 访问 磁盘 上 记录 的 
方法 ， 而 现在 对 于 如 何 优 化 设计 还 没有 一 致 的 观点 。 事 实 上， 有 多 种 类 型 的 索引 结构 ， 而 且 
如 果 不 了 解 磁盘 访问 的 某 些 细节 ， 是 不 可 能 了 解 这 些 类 型 的 优点 的 。 举 个 例子 ， 我 们 将 学 习 
一 种 称 为 二 分 查找 法 的 算法 ， 对 于 查询 内 存 中 已 经 排序 了 的 列表 中 的 键 值 而 育 ， 它 几乎 是 最 
有 效 的 方法 ;但 是 对 于 基于 磁盘 上 的 结构 ， 它 就 不 是 最 优 的 方法 。 所 有 商业 数据 库 系统 都 采 
用 不 同 的 一 可 以 称 完全 不 同 的 一 一 方法 来 存放 行 的 实际 的 数据 结构 、 分 配 引用 的 指针 并 完成 
其 他 在 下 面 要 讨论 的 很 多 细节 方面 。 同 时 ， 虽 然 不 同 的 产品 之 间 有 很 多 不 同 点 ， 但 是 体系 结 
构 上 也 有 很 多 相同 点 ， 我 们 将 着 重 讨论 ORACLE 和 DB2 UDB 中 的 索引 细节 。 我 们 不 讨论 
INFORMIX 的 索引 细节 是 因为 有 INFORMIX 的 不 同 版 本 INFORMIX XPS， 它 的 索引 结构 很 复 


338 发 兢 涯 左 理 、 轿 得 与 性 能 


区。 有 计划 想 让 岗 个 INFORMIX 版 本 结合 ， 到 时 ， 我 们 会 在 我 们 的 主页 www:iiwww.cs.umb. 
edu/~poneilidbppp.html 上 提供 有 关 INFORMIX 索 引 的 细节 。 


8.2 磁盘 存储 


我 们 纪 经 讲 过 ， 基 本 表 中 的 行 各 创建 的 索引 是 存储 在 磁盘 十 的 。 当 它们 被 访问 的 时 蛋 ， 
将 被 读 人 到 内 存 中 。 在 第 1 章 中 我 们 说 过 ， 数 据 库 必 须要 保证 持久 性 ， 所 以 磁盘 是 最 适合 的 存 
储 介 质 。 我 们 称 计算 机 内 存 是 雪 失 性 看 储 器 ， 因 为 虽然 可 以 快速 访问 内 存 ， 但是 如 单 计算 机 
电源 关闭 或 者 其 他 引起 计算 机 系统 故障 发 生 的 话 ， 内 存 中 的 数据 是 无 法 保留 下 来 的 。 磁 盘 被 
称 为 非 蓝 失 性 丰 钞 器 ， 或 者 有 时 候 被 称 为 持久 性 存储 器 ， 意 思 足 即使 电源 关闭 上 面 的 数据 仍 
然 不 会 丢失 一 -正如 每 一 个 人 都 知道 的 可 以 把 磁盘 上 的 数据 从 -- 台 计算 机 复制 到 另外 -一 台 放 
算 机 - 在 本 书 中 ， 读 者 可 区 学 到 其 他 许多 软件 方法 ， 这 些 软件 方法 可 以 玫 助 系统 从 系统 故障 
虑 至 磁盘 故障 中 恢复 。 磁 盘 很 便宜 ， 因 此 在 洗 多 系统 中 使 用 ,全 是 人 役 盘 的 访问 速度 很 慢 。 我 
们 将 要 看 到 ， 册 于 磁盘 访问 速度 很 慢 ， 所 以 需要 使 用 数据 库 的 索引 结构 ， 

1. 磁盘 访问 器 度 是 极 慢 的 

并 平 每 一 个 人 知道 ， 近 几 十 人 年 来， 计算 机 变 得 越 来 越 快 ， 也 恋 得 越 来 越 便 宜 。 据 说 ， 训 
果 夫 1950 年 开始 ， 汽 车 工业 的 发 展 速 度 和 计算 机 工业 发 展 一 样 锯 的 两， 读者 现在 束 可 以 花 几 
美元 头 一 辆 汽车 ， 只 消耗 一 加 仓 的 汽油 ， 花 一 小 时 就 可 以 奏 地 球 开 到 月 球 。 而 且 计 算 机 工 炎 
的 发 展 速 度 还 将 继续 保持 。 现 在 一 台 不 算 很 贵 的 计算 机 的 CPU 繁 秒 可 以 执行 十 忆 条 指令 
{100MIPS)。 当 然 ， 执 行 不 问 的 指令 花费 的 时 间 是 不 同 的 ， 人 得 是 ， 这 个 速度 是 对 相对 较 快 的 计 
算 机 上 的 一 个 标准 指令 集 测 出 的 大 致 速度 。 

矿 盘 访问 速度 是 影响 数据 库 系 统 性 能 的 重要 方面 。 磁 盘 访问 速度 的 提高 并 不 和 CPU 执行 
速度 的 提高 同步 。 磁 盘 是 一 种 旋转 的 磁性 记录 介质 ,通常 是 一 些 盘 片 堆 在 一 起 组 成 。 锅 在 一 
个 中 等 性 能 磁盘 的 标准 旋转 速度 是 每 秒 120 转 ， 另 外 还 有 一 个 磁盘 臂 用 寺 读 取 数 据 ， 就 象 老式 
的 唱机 一 样 。( 磁盘 的 旋转 速度 和 磁盘 臂 的 称 动 速度 存 最 近 五 年 内 翻 了 -一 备 ， 而 量 随 着 新 产品 
的 问世 ， 将 不 断 提高 )。 磁 盘 臂 的 一 头 是 一 些 位 于 磁盘 表 而 的 读 写 磁头 。 当 磁盘 臂 移动 到 指定 
位 置 时 ， 磁 头 也 同时 移动 以 寻找 同心 柱 面 上 的 数据 《这 些 同 心 柱 面 是 由 评 族 鼻 片 去 面 上 的 琵 
道 组 成 }。 -个 磁道 又 分 成 若干 个 请 区 ， 每 个 筷 区 通常 包含 512 个 字 节 。 现 在 ， 一 个 普通 的 页 
盘 可 以 包含 10GB 的 数据 ， 每 一 个 磁道 包含 200 个 遍 区 《各 个 产品 实际 包含 的 肩 区 数 可 能 有 些 
变化 )， 每 个 遍 区 包含 512 个 字 节 。 磁 盘 通 常 有 10 个 磁盘 表面 【因此 一 个 柱 面 大 约 包 含 1MB 的 
数据 ) 和 大 约 10 000 个 磁盘 柱 而 。 为 了 读 写 磁盘 上 的 数据 ， 伐 盘 臂 必须 先 快 速 地 移动 到 正确 
的 柱 而 位 置 ， 然 后 等 待 磁盘 旋转 ， 直 到 磁头 正好 指向 指定 的 而 区 。 这 样 磁 头 从 某 一 个 旋转 介 
质 的 盘 片 表面 上 的 一 系列 的 户 区 中 读 取 数据 ， 这 一 系列 的 筷 区 被 称 为 磁盘 页 面 ， 或 者 简称 为 
页 面 。 一 次 磁盘 页 面 访 问 通 常 由 三 个 过 程 ， 这 三 个 过 程 的 度量 标准 如 下 : 

寻 道 时 间 : 磁盘 臂 移 动 到 指定 柱 而 的 时 间 。 

旋转 延 时 ， 磁盘 旋转 到 指定 的 励 区 的 时 间 。 

传输 时 间 : ”磁盘 臂 读 写 相应 表面 上 的 磁盘 页 面 的 时 间 。 

国 为 磁盘 访问 需要 一 个 物理 操作 ， 所 以 在 磁盘 上 随机 读 取 一 个 页 面 数 据 需要 的 时 间 比 过 
行 -- 条 计算 机 指令 所 需 的 时 间 志 多 得 多 : 一 次 磁盘 访问 需 归 大 敏 0.0125 秒 ， 即 1780 秒 。 这 
0.0125 秒 是 大 敏 按 王 列 时 间 分 配 的 : 
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寻 道 时 间 : 0.008 秘 。 

旋转 延 时 :0004 秒 。 

传输 时 间 : 0.0005 秒 ({ 大 敏 传输 几 干 个 字 节 六 

导 道 时 间 的 变化 范围 很 大 ， 主 要 依赖 于 磁 总 臂 起 始 位 置 和 要 移动 到 正 确 柱 面 的 趾 离 。 如 
果 两 个 要 连续 读 取 的 数据 块 在 磁盘 上 是 紧 挨 着 的 ， 那 么 寻 道 时 间 是 很 短 的 ; 如 果 这 两 个 数据 
块 在 同一 柱 面 | 上， 那么 寻 道 时 间 为 零 。0.008 秘 的 平均 导 道 时 | 间 ， 是 假设 在 这 两 个 数据 央 在 任 
意 柱 面 上 的 概率 是 相等 的 基础 上 计算 出 来 的 。 这 里 的 旋转 延 时 和 转速 为 120 转 /每 秘 的 磁盘 旋 
转 半 圈 所 需 的 时 间 是 相等 的 ， 因 为 我 们 假设 乔 要 该 取 的 肩 区 可 能 处 于 磁道 上 的 任何 位 置 ， 

在 一 台 CEU 囊 度 为 100MIPS 的 计算 机 上 ，- 旦 数据 被 读 人 内 存 ， 该 数据 可 以 被 一 条 指令 
在 0.000 000 01 秒 【0.01hs ) 内 访问 到 ， 磁 盘 访 问 速 度 和 内 存 访问 则 度 之 间 的 善 别 是 巨大 的 : 
在 读 写 一 个 磁盘 页 面 的 时 间 里 ， 我 们 可 以 执行 1 250 000 条 指令 。 我 们 短 个 类 比 ， 假 设 你 是 美 
国 苹 命 时 期 伏 尔 泰 的 秘书 ， 负 责 复 制 伏 尔 泰 的 信 。 我 们 假设 你 需要 一 秒 钟 来 复制 一 个 单词 ， 
我 们 可 以 把 写 信 比 作 执行 某 个 程序 中 的 几 百 条 指令 。 现 在 ， 你 发 现存 一 个 单词 因为 伏 尔 泰 字 
迹 流 草 而 大法 办 别 。 不 幸 的 是 ， 优 尔 泰 本 人 现在 在 圣彼得堡 ， 你 需要 写 一 封 信 给 他 本 人 米 询 
问 这 个 单间 的 拼写 。{ 类 似 地 ， 当 数据 库 系统 需要 在 磁盘 上 读 取 --- 些 信息 ， 系 统 需 要 扫 行 一 系 
列 的 指令 来 完成 该 读 取 操作 ) 你 给 伏 尔 泰 写 了 信 ， 回 到 办 公 室 等 上 六 个 星期 ， 直 到 傣 尔 泰 回 
信 。 这 和 系统 等 0.0125 秒 直到 磁盘 上 的 数据 被 读 到 内 存 中 很 类 似 。 很 明显 ， 我 们 希望 尽量 避 
免 执 行 磁盘 读 取 操作 ， 队 非 是 必须 的 。 

需要 说 明 的 是 ,一旦 磁盘 辟 移 动 到 人 磁盘 上 的 正确 位 置 ， 你 不 要 只 读 取 一 两 个 字 节 。 读 取 
一 两 个 字 节 的 传输 时 间 是 很 短 的 ， 人 磁盘 访问 时 间 主 要 是 称 动 磁盘 辟 到 指定 的 位 置 所 逢 的 时 间 ， 
一 旦 移动 完毕 ， 传 输 数据 的 速率 是 每 秒 几 百 万 个 字 节 。 所 以 ， 我 们 可 以 发 现 所 有 的 磁盘 访问 
都 是 “面向 页 面 的 "”。 对 于 很 多 产品 ， 一 个 页 面 的 大 小 是 2KB 例 如 ORACLE， 而 另外 -: 些 产品 
一 个 页 面 的 大 小 是 4KB 例 如 DB2 UDB (DB2 UDB 和 其 他 一 些 产品 还 支持 更 大 的 页 面 ， 葬 如 
8KB、16KB 和 32KB， 人 是 对 于 大 多 数 用 户 而 言 ， 标 准 下 面 大 小 偿 是 4KB )， 每 次 读 取 2KB 或 
者 4KB 的 数据 到 内 存 中 ， 就 好 象 给 伏 和 尔 泰 写 一 封 长 信 询 问 大 其 的 问题 ， 秘 书 只 不 过 堵 等 几 个 
小 时 而 已 。 很 明显 ， 这 样 做 很 值得 ， 因 为 从 磁盘 上 读 取 一 个 页 面 ， 并 把 它 保 留 在 内 存 中 ,这 
样 下 一 次 访问 这 一 页 面 的 时 候 就 不 用 再 从 磁盘 上 读 取 了 。 图 8-2 说 明了 数据 库 系 统 是 上 笃 人 么 样 对 
磁盘 页 面 在 内 存 中 做 组 证 的 。 

在 图 8-2 中 ， 我 们 看 到 数据 库 系 统 按 照 给 定 的 磁盘 页 面 地 址 {用 符号 dp 表示 ) 读 取 磁盘 页 
面 ， 并 抒 这 些 磁 盘 页 面 存放 到 内 存 中 被 称 为 缓冲 区 的 地 方 【 这 些 缀 冲 区 是 在 数据 库 系 统 初始 
化 的 时 候 建立 的 )。 磁 可 页 面 地 址 (dp) 可 以 是 连续 的 整数 (1,2,3,…)， 也 可 以 由 设备 号 、 柱 面 号 、 
磁盘 表面 号 和 开始 扁 区 地 址 组 成 。 每 一 个 读 入 的 页 面 在 一 个 称 为 韶 列 后 备 表 的 结构 里 都 有 一 
个 对 应 的 项 ， 该 项 指向 了 该 页 面 在 缓冲 区 中 的 位 置 。 每 一 次 读 取 页 面 的 时 候 ， 我 们 首先 对 页 
面 地 址 黎 散 刀 操 作 ， 然 后 在 散 列 后 备 表 中 查询 该 页 面 是 否 已 经 在 条 冲 区 中 。 如 打 该 页 面 已 经 
在 缓冲 区 中 ， 那 么 我 们 将 忽略 磁盘 访问 这 一 步骤 ; 否则 ， 我 们 将 在 缓冲 区 中 找到 一 个 页 面 ， 
站 新 读 入 的 页 面 替换 它 。 我 们 将 替换 长 时 间 不 使 用 的 页 而 ， 以 便 缓 神 区 中 的 负面 总 是 经 常 被 
使 用 的 页面 。 

既然 我 们 要 从 磁盘 上 读 取 整 个 页 面 ， 我 们 将 对 访问 要 求 进 行 组 织 ， 以 便 所 有 需要 的 信息 
都 在 同一 个 页 面 上 ,我们 将 要 看 到 ， 这 对 索引 结构 有 重要 的 影响 。. -个 索引 结构 的 最 重要 的 
特性 是 最 小 化 访问 磁 碍 操作 的 数目 。 
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图 8-2 磁盘 贡 耐 色 促 及 后 备 


既然 往 盘 访问 比 内 存 访问 要 慢 很 多 ， 一 个 很 自然 的 问题 是 : 为 什么 不 完全 使 用 内 存 来 进 
行 数据 访问 呢 ? 当然 ， 我 们 已 经 提 到 过 ， 内 存 是 不 稳定 的 ， 也 就 是 说 当 计 算 机 因为 某 种 原因 
山 澳 的 时 收 ， 内 存 中 修改 过 的 数据 将 会 丢失 ,但 是 具有 事务 处 理 特性 的 数据 库 的 一 个 主要 日 
标 是 ， 当 计算 机 骨 澳 的 时 蛋 ， 能 保证 内 存 中 更 新 过 的 数据 不 会 丢 兴 。 这 一 特性 被 称 为 事务 性 
恢复 ， 我 们 将 在 第 10 章 中 进行 详细 阐述 。 即 便 如 此 ,事务 性 恢复 需要 两 个 基本 条 件 ， 一 是 数 
据 被 备份 到 非 易 失 介质 上 ， 二 是 恢复 日 志 被 记录 到 稳定 的 介质 上 。 现 在 ， 所 有 主要 的 数据 库 
系统 都 把 太 盘 作为 非 易 失 性 介质 ， 并 并 行 地 写 人 两 个 独立 的 磁盘 来 模拟 稳定 介质 ， 这 样 能 六 
免 因为 其 中 一 个 磁 静 的 故障 而 导致 丢失 日 志 信息 。 

所 以 在 数据 库 系 统 中 ， 我 们 不 能 没有 袜 盘 ， 但 是 这 样 就 提出 了 在 CPU 速 度 这 么 快 的 情况 
下 ， 如 和 何 使 用 低速 磁盘 的 问题 。 为 什么 我 们 不 能 把 所 有 可 能 访问 的 数据 都 先 放 在 一 个 很 大 的 
缓冲 区 (如 我 们 在 图 8-2 中 的 那 种 ) 中 ， 这 样 来 保持 所 有 的 访问 操作 都 在 内 存 中 进行 呢 ? 事实 上 ， 
很 多 数据 库 是 这 么 想 的。 实现 缓冲 区 所 涉及 的 算法 是 很 有 效 的 ， 所 以 当 缓 冲 区 中 的 页 面 个 数 
增加 的 时 候 。 所 需要 的 CPU 时 间 不 会 增加 。 很 多 大 型 数据 库 的 用 户 购 买 了 越 来 越 大 的 内 存 来 
提高 访问 速度 。 但 是 我 们 还 没有 意识 到 这 种 方法 的 潜力 。 在 不 久 以 前 ， 对 于 大 多 数 企 业 来 说 ， 
内 存 的 价格 还 是 很 高 欧 ， 他 们 不 太 可 能 购买 几 吉 字 节 的 内 存 来 装载 数据 ， 所 以 磁盘 是 他 们 唯 
一 的 选择 。 和 和 个 人 计算 机 相 比 ， 服 务 器 的 内 存 价格 还 是 很 高 的 ， 但 是 价格 不 再 是 决定 购买 磁 
盘 还 是 内 存 的 主要 因素 。 于 面 是 对 内 存 和 磁盘 价格 的 估计 : 

内 存 价格 ， 大 约 4000 美 元 /GB 。 

磁盘 价格 : 天 约 100 美 元 /GB。 

花 同样 多 的 钱 ， 我 们 可 以 购买 40 倍 数量 的 磁盘 。 考 虑 到 一 家 小 公司 不 太 可 能 使 用 超过 
1GB 的 数据 库 (可 能 需要 更 多 的 存储 器 作为 备份 或 者 其 他 用 处 ， 而 磁盘 可 以 完成 这 一 任务 ). 
如 果 性 能 非常 重要 的 话 ，4000 美 元 的 价格 不 太 可 能 会 阻止 用 户 购 买 内 存 ， 另 外 一 方面 ， 如 果 
性 能 并 不 是 很 重要 的 话 ，4000 美 元 的 开销 似乎 有 些 浪费 。 使 用 小 数据 库 的 小 公司 可 能 每 天 可 
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能 不 需要 做 多 少 事务 操作 ， 人 他们 记 为 性 能 是 第 二 位 的 。 需 要 高 性 能 的 埃 公 司 可 能 党 要 超过 
10GB 的 数据 库 ， 他 们 就 需要 在 内 存 中 使 用 缓冲 区 。 但 是 计算 机 设计 者 需要 扩展 肉 存 地 址 的 大 
小 ， 现 在 内 存 地 址 是 32 位 ， 在 大 多 数 计算 机 上 大 概 能 访问 4GB 的 内 存 地 址 ,一 些 新 的 并 行 计 
算 机 已 经 采用 了 64 位 的 体系 结构 ，IBM 岂 提供 了 不 同 3 位 地 址 空间 声 摸 的 方法 好 几 年 站。 这 
一 切 部 表明 不 和 久 的 将 来 ,我们 可 能 可 以 在 花费 15 美 分 的 汽车 中 花费 几 分 钟 就 到 达 火 星 了 。 

2. DRACLE 中 的 DBA 和 磁盘 资源 分 配 

在 第 7 章 中 ， 我 们 设 有 考虑 表 的 租 盘 空间 的 分 配 ， 但 其 实 这 是 DBA 最 重要 的 任务 之 -一 、 不 
素 的 是 ， 这 个 问题 和 特定 的 数据 库 产 品 有 关 ， 因 为 不 同 的 商业 数据 库 系 统 的 体系 结构 有 很 大 
的 相同， 所 以 使 得 任何 标准 的 SQL 方法 都 撩 效 了 。 人 但 是 ， 大 多数 数据 库 产 品 对 于 处 理 数 据 分 
配 有 相同 的 一 般 方 法 ， 所 不 同 的 是 ， 它 们 在 细节 问题 的 处 理 上 有 很 大 的 相同 。 下 面 我 们 将 说 
明 看 ORACLE 中 怎么 完成 磁盘 资源 分 配 。 我 们 不 会 再 详细 地 描述 其 他 数据 库 产 品 ， 读 者 如 畔 
起 话 细 了 解 的 话 ， 可 以 参考 本 章 绪 尾 的 “推荐 读物 "。 

在 创建 数据 库 前 ，DBA 首 先 和 需要 和 在 磁盘 上 分 配 一 些 操作 系统 文件 ， 假 设 这 些 文 件 名 是 
inamel,ftname2,…-。 这 些 文件 和 用 户 编 辑 的 交 本 文件 或 者 C 请 言 源 文件 是 问 一 种 类 型 的 文件 。 
许多 操作 系统 允许 DBA 指 定 文件 的 大 小 和 文件 所 在 的 磁盘 设备 。 如 果 而 区 是 紧 挨 彰 的 一 一 几 
区 在 同一 柱 面 上 是 连续 分 布 的 一 一 我 们 称 磁 盘存 储 器 是 连续 的 。 让 磁盘 空间 连续 分 布 可 以 使 
得 寻 道 时 间 最 小 ， 大 款 数 系统 在 分 配 文 件 空间 的 时 候 会 使 文件 分 配 在 一 大 块 连续 的 空间 内 。 
问 时 ， 大 多 数 操 作 系 统 文件 设 有 跨越 磁盘 设备 的 灵活 性 。 对 于 这 些 操作 系统 文件 ，DBA 可 能 
使 用 如 下 的 ORACLE 命令 : 


create tablespace tspacel datafile “十 mamel"， "name2'; 


表 空 间 是 ORACLE 数 据 库 基本 的 分 配 介 质 ， 所 有 请 求 爸 盘 定 间 的 表 、 索 引 和 其 他 对 象 都 
在 表 空 间 中 收 到 分 配色 它们 的 空间 。 表 空间 对 应 于 一 个 或 多 个 操作 系统 文件 ， 也 可 以 跨越 多 
个 往 盘 设备 。 在 大 客 数 操作 系统 中 ，ORACLE 可 以 创建 或 扩展 操作 系统 文件 ， 虽 然 管理 员 可 
会 损失 一 些 精确 度 。 另 外 ， 表 空间 也 可 以 创建 在 “原始 磁盘 分 区 ”上 ， 即 该 磁盘 设备 不 是 
操作 系统 文件 系统 的 一 部 分 ， 而 ORACLE 可 以 不 通过 文件 系统 服务 来 使 用 它 ,【 虽然 和 在 本 书 中 
我 们 不 会 讨论 使 用 原始 磁盘 分 区 ， 但 是 读者 应 该 知道 ， 如 果 在 性 能 是 第 一 位 的 情况 下 这 种 原 
始 磁盘 分 区 是 很 重要 的 。) 所 有 的 数据 库 产 品 都 有 类 似 于 表 空 间 的 结构 来 隔离 用 户 和 操作 系统 : 
DB2 UDB 称 之 为 下 室 间 ，INFORMIX 称 之 为 数据 库 空间 。 在 各 种 情况 下 ， 它 代表 了 一 块 可 以 
使 用 的 伐 盘 空间 ， 这 块 磁 盘 空 间 可 能 会 跨越 多 个 磁盘 设备 。 
下 面 是 一 个 Create Tablespace 语 句 的 例子 ， 它 使 ORACLE 创 建 两 个 文件 fname3,fname4: 


create tablespace tspace2 datafile "fname3" SiTe 200M, 
datafile 'fnamed” size 300M; 


关键 字 SIZE 后 的 整数 代表 了 字 节 数 。 如 果 整 数 后 面 跟着 KK， 则 代表 干 宁 节 数 ; 如 果 整 数 
后 面 跟着 是 M， 则 代表 兆 字 节 数值 得 注意 的 是 1KB 实 际 是 2”= 1024 字 节 ，1MB 实 际 是 2” = 
1 048 576 字 节 。 许 多 ORACLE 数 据 库 包 售 多 个 表 空 间 ， 其 中 一 个 表 空间 的 名 字 是 SYSTEM ,，, 
这 个 表 空 间 是 在 执行 Create Database 命 令 的 时 候 由 系统 自动 建立 的 。SYSTEM 表 空间 包 售 了 数 
握 库 的 数据 字典 {我们 称 为 系统 日 录 表 )， 也 可 以 为 用 户 定 义 的 表 和 索引 以 及 其 他 数据 库 对 象 
提供 表 空 间 。 由 DBA 决 定 是 否 可 以 创建 多 个 命名 的 表 空间 。 在 大 型 系统 上 创建 多 个 表 空 间 有 
两 个 优点 : (1) 何以 让 不 同 的 磁 堆 设 和 押 作 不 同 的 用 钼 ，(2} 如 果 邵 下 堪 个 磁盘 ， 不 会 影响 到 整个 
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数据 库 。 

当 DBA 或 者 具有 CREATE TABLE 权 限 的 用 户 创 建 表 或 者 索引 的 时 候 ， 可 以 使 用 Create 
Table 或 Create Index 语 句 的 可 选 子 句 TABLESPACE。 这 个 子 名 可 以 让 用 户 指定 甫 空间 的 名 字 和 和 
表 空 间 所 在 的 磁盘 ( 参见 图 8-5 中 Create Table 语 名 的 语法 )。 如 果 没 有 创建 任何 命名 的 表 空 间 ， 
表 将 创建 在 才 户 缺 省 的 表 空 间 内 ， 该 表 空 间 将 在 用 户 第 一 次 被 授予 才 空 间 资 源 的 时 候 设 置 ， 
创建 表 的 时 候 ， 它 的 表 空 间 分 配 是 以 叫做 数据 段 的 对 象 标 识 的 ; 创建 索引 的 时 息 ， 它 是 以 叫 
做 索引 段 的 对 象 标识 的 。 还 有 一 些 其 他 类 型 的 段 ， 它 们 共同 划分 了 .个 表 空 间 。 和 参见 图 8-3， 
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图 8-3 数据 库存 情结 构 


当 创 建 数据 段 或 者 索引 段 的 时 候 ， 将 从 表 空 间 中 分 配 一 个 初始 的 磁盘 空间 ， 称 为 初始 区 
域 。 初 始 区 域 的 缺 省 大 小 是 10KB。 每 :次 当 数 据 段 的 大 小 快 超过 指定 空间 大 小 的 时 候 ， 都 会 
再 分 配 一 块 区 域 ， 被 称 做 下 一 区 域 ， 以 1 开始 的 整数 编号 。 图 8-3 是 一 张 表 明 上 述 逻 辑 结 构 的 
不 意图 。 值 得 注意 的 是 ， 每 一 块 区 域 都 在 一 个 数据 文件 上 (在 图 8-3 中 很 难 表 示 这 一 点 }。 
一 个 区 域 必须 构成 表 空 间 的 单个 文件 中 的 连续 磁盘 空间 组 成 ， 但 是 一 个 段 可 以 是 由 来 自 
多 个 文件 的 区 域 组 成 。 可 以 在 创建 表 空 间 的 时 候 指定 一 些 参 数 来 处 理 新 的 区 域 的 分 配 。 该 表 
空间 所 有 的 段 都 按 这 些 参 数 设 定 。 图 8-4 是 Create Jablespace 语 人 句 的 部 分 语法 。 
CREATE TABLESPACE tblspacename 
DATAFILE "Filename’ [Size m [KM]J] CREUSEY [AUTOEXTEND OFF 
上 AUTOEXTEND ON [NEXT n CRIM] CMHAXSTZE {UNLIMITED |n CK|MJ}] 
{, ‘filename™ (repeat SIZE. REUSE, and AUTOEXTEND options) ， 
-- the folliowing optional clauses can come in sny order 


{CONLINE | OFFLINE] 
[DEFAULT STORAGE (CLINITIAL n EKIM]] CNEXT n EKEMI] CMINEXTENTS n] CMAXEXTENTS {n|UNLIMITED}] 


FPCTINEREASE n])》 taddftional DEFAULT STORAGE options not covered)] 


CMINIMUM EXTENT n CK|M]] 
[other optional cléauses not covered]: 





图 8-4 ORACLE 的 Create Tablespace 语 法 


我 们 已 经 说 过 ,; 表 空间 是 由 多 个 在 DATAFILE 子 名 中 指定 的 操作 系统 文件 组 成 。 如 果 没 有 
使 用 关键 字 SIZE， 数 据 文件 必须 已 经 存在 ， 而 且 ORACLE 凡 它 的 名 字 使 用 该 文件 。 如 果 使 用 
了 关键 字 SIZE，ORACLE 会 按 指定 的 文件 和 名 创建 一 个 新 文件 ， 如 果 该 名 字 的 文件 已 经 存在 ， 
则 删除 以 前 所 有 和 使 用 该 名 字 的 文件 。 只 有 当 关 键 字 SIZE 出 现 的 时 候 ，REUSE 才 有 意义 。 
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REUSE 关 键 字 允许 ORACLE 重新 使 用 - -个 已 经 存在 的 文件 (ORACLE 会 首先 检查 文件 大 小 是 
相 正 确 )， 这 个 文件 原来 的 内 容 将 会 被 役 坏 。 

AUTOEXTEND 子 句 决 定 DRACLE 是 否 可 以 自动 扩展 数据 文件 的 大 小 。 如 果 使 用 的 是 
AUTOEXTEND ON， 慰 么 NEXT [KIM] 将 指定 每 次 新 申请 的 区 域 的 大 小 。 值 得 注意 的 是 ， 文 
件 扩展 的 大 小 可 能 比 需要 的 区 域 大 小 大 很 和 多。 MAXSIZE 子 句 次 定 了 文件 最 大 了 以 扩展 的 大 小 ， 
可 以 星 有 限 的 宇 节 数 ， 也 可 以 是 UNLIMITED,。 读者 应 该 注意 ， 即 使 使 用 的 是 UNLIMITED 参 
数 ， 文 件 系 统 本 加 也 会 个 一些 限制 。 

缺 省 情况 下 ， 表 空间 是 联机 (ONLINE) 创 建 的 ， 意 思 是 可 以 立即 内 数据 库 系统 使 用 。 和 如果 
表 裕 间 是 脱 机 LOFFLINE) 创 建 的 ， 那 么 它 不 能 被 立即 使 用 。 脱 机 创建 的 表 空 间 可 以 被 DBA 使 
用 Alter Tablespace 计 人 句 改 成 联机 方式 ( Alter Tablespace 诸 名 在 本 书 中 没有 讲述 )。S$YSTEM 去 
空间 始终 是 用 Create Database 语 句 联 机 创建 的 。 

Create Tahjespace 语 名 的 DEFAULT STORAGE 子 句 可 以 让 表 空 间 创 建 者 指定 缺 省 参数 来 
处 理 在 这 个 表 空 间 中 定 关 的 段 中 磁盘 区 域 分 配 。 下 面 是 这 些 参 数 的 含义 {这些 参数 可 以 按 任 
意 肪 上 厅 出 现 ): 

INITIAL n[ KINM) n 指 定 了 初始 区 域 的 大 小 ， 括 省 值 是 五 个 数据 块 中 的 子 竹 数 ， 

通常 是 10KB. 

NEXT n[KIM] n 指 定 了 下 一 区 域 的 大 小 ,第 一 个 下 一 区 域 的 缺 省 大 小 是 5 个 

数据 埃 ， 最 小 值 是 1 个 数据 块 {2KB }。 如 果 PCTINCREASE 
指定 一 个 正 值 ， 后 面 的 下 … 区 域 太 小 可 以 增加 (但 是 不 可 以 
减少 )。 

MAXEXTENTS n n 指 定 了 可 以 分 配 的 区 域 的 最 大 个 数 . 其 中 包含 了 初始 区 域 ， 

当然 也 可 以 指定 UNLIMITED 参 数 。 
MINEXTENTS n n 指 定 了 创建 段 的 时 候 初 始 分 配 的 区 域 个 数 。 认 为 区 域 必须 是 
连 绪 分 配 的 ,这 个 参数 允许 一 个 太 的 初始 区 域 分 配 ， 即 使 如 
用 磁盘 空间 是 不 连续 的 时 候 。 缺 省 侦 是 #， 

PCTINCREASE n 等 一 次 后 续 的 下 一 区 域 比 前 一 个 区 域 友 的 百分比 。 如 果 n 是 过 ， 
则 不 增加 。 馈 省 值 是 50， 意思 是 后 续 的 下 -区 域 比 前 … 个 区 
域 赤 50 护 。 

所 有 的 区 域 大 小 都 上 人 到 一 个 数据 块 (ORACLE 对 磁盘 和 负面 的 叫 法 ) 中 字 节 数 的 整数 售 ， 
一 个 区 域 大 小 的 最 小 值 是 2048 个 字 节 ， 最 大 的 值 是 4095MB。MININUM EXTENT 子 句 可 以 保 
证 Create Table 诸 名 在 不 使 用 Create Tablespace 缺 省 区 域 大 小 的 时 候 ， 不 会 选择 可 能 引起 过 多 至 
片 的 区 域 大 小 。MININUM EXTENT n[KIM] 将 保证 每 次 分 配 的 区 域 大 小 的 最 小 值 是 n 个 了 市 。 

在 图 7-3 中 ， 我 们 学 习 的 有 是 ORACLE 的 CREATE TABLE 语 名 的 简单 形式 。 在 图 8-5 中 ， 我 
们 提供 了 一 个 更 复杂 的 CREATE TABLE 语 名 语法 。 

Create Table 庄 句 的 新 的 子 句 从 可 选 的 ORGANIZATION HEAP( 这 是 缺 省 什 ) 和 
ORGANIZATION INDEX 开 始 。 一 个 堆 组 织 的 文件 是 新 的 行 存 放 在 任何 方便 的 位 置 上 (通常 是 
在 连续 区 域 的 连续 页 面 的 连续 位 置 上 )。 索 引 组 织 的 文件 是 新 的 行 存放 在 索引 和 里 ， 按 照 主键 值 排 
序 ， 我 们 会 在 8&.4 芳 中 讨论 主 索引 的 时 候 进 行 详细 靖 述 ， 但 是 当前 ORACLE 的 系 引 组 织 文件 和 一 
些 限制 ， 所 以 并 不 向 我 们 期 望 的 那样 有 用 。 
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CREATE TABLE [schema, Jtablename 
{{columnname datatype [DEFAULT fdefault_constant|NULL}] Ceol_constr {eol constr. . 1}] 
| table constr) -- choice of either columnname -definition or table constr 


{, (columnname repeat DEFAULT clause and col_constr list) | table constr} . . .1) 

CORGANTZATION HEAP | ORGANIZATINN INDEX tthis has clauses neat covered)] 

LTABLESPACE thlspacename] 

CSTORAGE CIIMITIAL n CKIMI] [CNEXT mn [KM]] CHINEXTENTS mn] [MAXEXTENTS (tn|UNLIMITEO}] 
[PCTINCREASE 7]} tadditional] STORAGE options not covered}] 

[PCETFREE n] [LPCTUSED n] 

Ldisk storage and other clauses (not covered, or deferred}]) 





[AS subyuery] 


图 85 ORACLE 中 的 Create Table 的 部 分 语法 


Create Table 语 名 中 可 选 的 STORAGE 子 句 可 以 让 表 的 创建 者 不 顾 表 空间 中 关于 区 域 分 配 
的 参数 设 定 。PCTFREE n 子 句 决 定 了 每 个 磁盘 页 面 上 可 以 有 客 少 空间 用 于 行 的 插 人 《参见 图 
8-6 中 磁盘 页 面 分 布 的 示意 图 ) n 的 变化 范围 是 0 到 99 ， 缺 省 值 是 10。n 的 值 为 10 表 明 如 果 当 页 
面 上 有 90% 空 间 已 经 被 使 用 了 ， 那 么 新 的 揪 人 操作 将 被 停止 。 如 果 n 的 值 为 0 意思 是 除非 页 而 
上 没有 可 用 空间 ， 否 则 新 的 插 和 人 操作 将 一 直 进 行 。n 如 果 取 比较 大 的 值 ,就 可 以 在 页 面 上 和 多留 
一 些 可 用 室 间 ， 这 些 可 用 空间 可 以 被 varchar 类 型 的 数据 使 用 ,或 者 在 Alter Table 语 句 中 用 于 
播 人 新 的 列 。PCTUSED n 了 名 指定 了 一 个 条 件 ， 当 已 用 空间 降 到 某 个 瑟 分 比 下 的 时 候 ， 新 的 
行 可 以 继续 插入 。 这 个 值 必须 是 从 1 到 99， 缺 省 值 是 40。PCTEFRERE 和 PCTUSRBD 的 和 必须 小 于 
100， 并 且 根 据 最 后 的 百分比 值 共 同 决定 了 磁盘 页 面 空间 大 小 稳定 的 范围 - 

举 个 例 于 ， 缺 省 设置 的 意思 是 当 页 面 空间 使 用 率 为 90 免 的 时 候 ， 页 面 会 锌 标记 为 满 ， 将 
不 能 播 人 新 的 记录 。 欠 有 当 页 面 空 间 使 用 率 降 到 40 吕 的 时 候 ， 才 可 以 插入 新 的 行 。 因此， 册 
面 是 不 时 地 插入 一 些 新 的 行 的 。 如 果 插 入 操作 频繁 。 这些 对 单个 页 面 的 连续 插 人 操作 可 以 区 
锡 对 单独 页 面 的 读 写 ， 因 为 所 需 的 页 面 会 一 直 存 放 在 缓 促 区 中 的 。 如 果 我 们 设 定 PCTFREE 为 
30，PCTUSED 为 60， 那么 插入 操作 只 能 使 页 面 保持 60 免 到 70 名 的 使 用 率 。 如 果 我 们 设 定 
PCTFREE = 20，PCTUSED =90 (两 者 的 和 是 110， 这 种 情况 是 不 应 该 发 生 的 )， 那 么 当 页 面 
的 使 用 率 为 80 允 的 时 候 ， 该 页 面 就 会 被 标记 为 满 ， 但 是 它 又 会 被 认为 可 以 立刻 进行 插 人 操作 ， 
因为 页 面 使 用 率 小 于 PCTUSED 的 值 。 这 是 一 种 异常 情况 。 

3. 数据 存储 页 面 和 行 指 针 : ORACLE 和 DB2 UDB 

一 旦 创建 了 表 并 分 配 了 初始 区 域 ， 我 们 就 可 以 向 表 中 装载 或 者 插 人 信行 。 在 一 张 玲 组 织 的 
表 中 ， 记 录 总 是 一 个 接 一 个 地 插 在 第 一 个 区 域 的 第 一 页 面 里 ， 直 到 第 一 个 页 面 的 空间 使 用 完 
和 毕 ， 然 后 使 用 第 二 个 页 面 。 当 初始 区 域 空间 使 用 完毕 的 时 候 ， 系 统 会 分 配 一 个 新 的 区 域 给 这 
张 表 。 这 一 过 程 将 一 直 继 续 ， 直 到 到 了 区 域 数 目 到 达 了 最 大 的 数目 或 者 没有 页 面 可 以 被 分 配 
了 。 每 一 个 行 是 由 包含 了 列 值 的 连续 的 字 节 组 成 的 ; 每 一 个 行 与 页 面 开 始 位 置 的 偶 移 量 古 已 
知 的 。 在 革 些 体系 结构 里 ， 可 能 某 些 长 的 行 的 大 小 会 超过 单个 页 面 的 大 小 ， 这 种 情况 我 们 会 
在 后 面 介绍 。 

图 8-6 给 二 了 一 个 典型 的 数据 存储 页 面 布局 情况 ， 在 图 8-6 中 该 页 面 上 有 N 个 行 。 头 信息 部 
分 (我们 通常 称 为 页 面 头 】 可 能 包含 了 显示 页 夯 地 址 (对 页 面 的 磁盘 访问 标识 符 ) 的 字段 、 
段 的 类 型 (索引 或 者 表 ) 等 信息 。 每 一 行 都 是 由 连续 的 字 节 组 成 ， 行 的 开始 位 置 都 是 从 页 面 
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中 特定 的 偏 移 量 开 始 的 { 要 记得 由 于 有 varehar(n) 关 型 ， 每 行 的 长 度 是 椒 一 致 的 ), 行 日 录 里 
的 实体 给 每 个 行 编号 ， 并 存放 每 行 在 页面 中 的 恼 移 量 。 在 熙 面 的 部 分 里 ， 我 们 通 靛 称 页 面 中 
的 行 目 录 号 为 槽 号 .， 在 图 8-6 所 示 的 体系 结构 里 ， 根 设 新 搬入 人 的 记录 是 从 石 圣 左 人 存放 的 ， 行 旧 
录 是 从 左 至 右 存 放 的 ， 而 中 间 的 可 用 空间 可 以 用 于 播 人 新 的 记录 。 这 意味 善 如 果 在 磁盘 页 向 
上 删除 一 行 并 回收 它 所 用 的 空间 ， 剩 下 的 行 会 向 右 称 动 ， 而 行 目录 《通常 木 会 删除 ) 会 问 左 
移动 ， 这 样 可 用 空间 仍然 在 中 间 部 分 、ORACLE 和 DB2 UDB 可 以 不 同 二 这 种 称 动 操作 ， 上 面 
讲述 的 只 是 大 多 数 系统 的 简单 结构 。 在 行 目 录 区 域 里 ， 可 以 存放 其 他 其 型 的 信息 。 例 如 ， 
ORACLE 允 许 不 同 表 中 的 行 出 现在 同 -个 磁盘 页 面 上 (在 ORACLE 中 入 稚 页 面 被 称 为 数据 块 ， 
或 者 简称 为 页 面 )， 在 这 种 情况 下 ， 头 信息 中 必须 要 有 一 个 表 目 录 来 区 别 不 回 表 中 的 行 。 


ay 可 用 空间 
行 目录 


图 8-5 位 盘 页 面 中 的 行 布局 


数据 库 表 中 的 行 可 以 被 行 出现 的 磁盘 页 将 地 址 和 该 页 面 中行 的 槽 号 唯一 标识 。 这 就 是 我 
们 纪 前 提 到 过 的 行 指针 ， 该 行 指 针 在 索引 结构 中 使 用 ， 用 于 按 给 定 的 党 引 键 值 来 指向 某 个 行 。 
为 了 方便 ， 我 们 使 用 页 面 中 的 逻辑 覃 号 来 指 回 行 ， 这 样 就 可 以 隐藏 不 必要 的 信息 。 因 为 好 果 
我 们 使 用 行 在 页 面 中 的 妃 移 量 ， 那么 如 果 在 某 个 页 和 面 重组 织 过 程 中 (例如 在 某 些 varchar 类 型 
的 列 的 宽度 可 雇 取 更 大 的 值 ， 或 者 可 用 空间 碎片 的 移动 ) 记录 发 生 了 移动 ， 那 么 索引 中 的 行 
指针 值 就 要 修改 。 和 而 如 果 使 用 逻辑 权 号 的 话 ， 即 使 页 面 中 行 位 置 发 生 淡 化 ， 索 引 中 指向 行 的 
指针 值 仍 然 保持 不 变 ， 只 要 行 目 录 实 性 仍然 存在 。 

行 指针 在 不 同 的 系统 中 有 不 同 的 和 名字。 在 ORACLE 中 称 为 ROWID ,在 PDB2 UDB 中 称 为 
RID， 通 常 我 们 统称 为 ROWID。 读 者 需要 知道 的 是 ， 行 指针 的 概念 个 存 在 于 侍 何 标准 中 ， 但 
是 这 里 解释 的 概念 是 非常 普遍 的 。 为 了 给 出 RID 的 思想 ， 我 们 再 来 看 看 本 书 第 1 版 中 所 到 的 
INGRES 中 的 TID {元 组 ID ) 的 概念 。INGRES 是 最 早 的 关系 数据 库 产品 ,但 是 我 们 并 没有 说 
我 们 对 于 TID 的 定义 已 经 过 时 了 。 在 INGRES 中 ， 数 据 库 表 可 以 被 分 配 连 续 的 磁盘 页 面 ， 这 些 
直面 都 分 配 了 一 个 磁盘 页 面 号 P，P 的 取 值 可 以 从 0 到 2 - 1， 最 多 可 以 有 8 328 608 个 页 面 。 这 
种 结构 允许 在 一 个 2KB 的 页 面 上 最 省 有 512 个 行 ， 所 以 构 号 的 范围 是 0 到 511， 可 以 表示 为 9 位。 
在 INGRES 中 行 指针 《TID ) 可 以 由 磁盘 页 面 号 P 和 槽 号 8 计算 得 出 : 

TR = 5]12 * FPF + Ss 

例如 ， 如 果 革 个 记录 的 S = 4, P =2， 那 乏 它 的 TID 的 值 为 2x 512 + 4 = 1028。 茶 奥 面 土 的 
槽 号 不 能 超过 511， 所 以 不 同 页 面 上 记录 的 TID 的 值 是 不 同 的 。 槽 导 是 由 9 个 比特 表示 ， 页 面 号 
由 23 个 比特 表示 ， 所 以 TID 的 值 是 由 32 个 比特 即 是 由 一 个 4 字 节 的 无 符号 整数 表示 的 。 除 了 有 
一 个 指针 指向 行 外 ， 也 可 以 把 TIiD 看 成 是 一 个 “ 虎 ” 列 ， 然 后 使 用 一 条 Select 语 句 得 到 TID 的 
值 ， 如 下 例 所 示 。 

例 8.2.1 假设 INGRES 数 据 库 的 DBA 刚 刚 装 载 了 一 个 表 名 为 employees 的 10 000 行 的 表 ， 
而 且 每 行 的 长 度 都 长 达 200 个 字 节 ， 但 是 每 行 之 间 的 长 度 差 别 不 大 。 妈 一 个 大 小 为 2048 个 字 市 
的 页 面 大 约 可 以 包 依 10 行 { 头 信息 部 分 和 行 日 录 部 分 也 需要 占用 人 嵌 盘 空 制 ， 对 于 不 同 的 列 也 
需要 一 些 磁 盘 空间 ， 但 是 我 们 假设 这 些 都 已 经 包含 在 200 字 节 的 长 度 里 了 。 为 了 免 去 具体 的 讨 
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算 ， 我们 这 里 假设 超过 2000 个 字 节 的 空间 可 以 被 数据 所 使 用 ， 这 样 的话 ， 一 个 2048 字 节 的 页 
面 上 可 以 包含 10 个 长 度 为 200 字 节 的 行 是 大 敏 正 确 的 )- 为 了 检查 一 个 页 面 是 否 包 含 了 10 行 ， 
DBA 可 以 利用 下 面 的 SQL 语句 来 恰 但 : 

select tid from empioyees where tid <= 1024; 

DBA 希 望 得 到 的 结果 是 0,1,2,3,4,5,6,7,8,9,512, 513, 514, 515, 516, 517,518, 519, 520， 
521,1024。 其 他 结 采 则 说 明 每 个 页 面 上 的 记录 数 不 为 10。 加 


DB2 UDB 的 行 指针 RRID 也 把 表 的 负面 号 和 权 号 编 成 一 个 4 字 广 的 整数 。 但 是 DB2 UDB 的 
RID 不 能 看 成 是 表 的 列 而 在 Select 语 句 中 使 用 。 另 外 DB2 UDB 的 RID 的 内 部 结构 是 不 会 开 的 ， 
而 且 IBM 警 告 说 在 今后 任意 时 刻 在 没有 任何 警告 的 情况 下 可 能 会 修改 这 一 -结构 。 

在 ORACLE 中 ，ROWID 是 一 个 6 字 节 长 的 整数 ， 有 两 种 可 能 的 形式 ， 限制 的 ROWIP 和 扩 
展 的 ROWID。， 根 制 的 ROWIDP 指 定 了 行 所 在 的 块 号 《 磁 胡 页 而 号 }、 沁 头号 《我 们 称 为 粳 号 ) 
和 操作 系统 的 文件 号 。ROWID 是 由 三 部 分 表示 的 ， 如 下 每 个 字母 都 代表 一 个 16 进 制 数 ); 

BHBBEBBB.RRRR.FFFE 


这 里 BBBBBBBB 代 表 了 文件 中 的 块 号 ，RRRR 代 表 了 行 号 ，FFFF 代 表 了 文件 号 。 例 如 ， 
0000000F.0003.0002 说 明 该 行 处 在 第 2 号 文件 的 第 15 个 块 的 第 3 个 梢 中 。 限 制 的 ROWID 占 用 了 6 
个 学 节 的 空间 ， 并 且 出 现在 索引 项 中 。 可 以 把 ROWID 看 成 是 -- 个 “ 虚 ” 列 ， 并 可 以 在 Select 
语句 中 使 用 ， 如 下 所 示 ， 


select cname, rowid from customers where city = “Dallas'; 


可 能 得 到 的 结果 是 (很 设 是 限制 的 ROWID ): 


亡 网 点 可 所 CRUMID 
Basics DOODOEFS. 0000 .0001 
Altlieped DOOOOEF3 .O00 .0001 


而 扩展 的 ROWID 表示 为 一 个 由 4 部 分 组 成 的 字符 串 ， 如 下 所 示 《【 每 一 个 字母 表示 为 一 个 基于 
64 的 编码 ); 

OONOOGOOFFFBEBBRNRRR 

这 里 COOOOO 是 数据 对 象 号 ， 代 表 了 -- 个 数据 库 的 段 ( 例 如 表 )。FFEF、BBBBB 、RRR 
分 别人 代表 了 文件 号 、 块 号 和 行 导 【 粳 号 )。 这 里 的 编码 是 基于 奴 的 编码 ,除了 有 的 个 数字 以 外 ， 
与 二 六 进 制 表示 法 兼容 ， 该 编码 和 可 打印 的 字符 对 应 关系 如 下 : 


DIG1TES HARALCTERS 

QD to 25 A to 了 tcapital letters} 
eh to m1 a to z {lowercase lettersy} 
5a to bl 0 to 9 《decimal digits) 

Br and b+ + Bhd fF respectively 


例如 ，AAAArm5sAABAAAEUMAAB 代 表 了 对 象 号 是 AAAAm5S= 38 x64 4+57， 文 件 好 是 
AAB = 1， 块 号 是 AAAEIM = 4x 642+45 x 64+13， 槽 号 是 1。 而 查询 ， 


selert cname, rowid from customers where city = ‘Dallas"; 


可 能 返回 的 结果 是 : 
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CNAME ROWID 
Basics 下 页 丰 中 作品 直 页 季 呈 丰 矶 E 十 辣 丰 戌 下 
上 | ] ied 下 站 高 高 FT 品目 站 日 贞 辣 起 民 寸 网 下 下放 


因为 一 个 索引 是 和 一 张 表 关联 的 ， 所 以 索引 项 中 的 ROWID 的 值 没 有 必要 包括 唯一 表 段 的 
对 象 导 。 但 是 ，Select 语 句 通 常 显示 扩展 形式 。 我 们 以 后 将 使 用 ROWID 来 统称 任 一 数据 库 中 
的 行 指 针 。 

例 8.2.2 ”考虑 下 面 的 嵌 人 式 SQL 语 名 ， 它 的 作用 是 从 表 中 读 出 一 行 ， 然 后 调用 -个 复杂 
的 决策 过 程 ， 完 成 把 taxcode 列 置 为 1 的 行 更 新 。 

EXET S91] select * nto :emprTet 


from employee where eid = ;empidyal; i* Unidgue row 本 


decisionprocthemprec, Syesnoy; i* call decision procedure function */ 


if (yesnoy f* if flag was Set to yes = 
Exec sql Update employae set taxcode = 1 i* perform update i 
where eid = :emMpidval: 


exec sql commit: 

值得 注意 的 是 ， 为 了 更 新 所 需 的 smployee 的 列 ， 将 taxcode 设 置 为 1 的 Update 诸 铝 需 要 抑 
成 第 二 次 查找 满足 条 忻 的 行 ， 可 能 是 通过 一 个 唯一 的 empia 索 引 。 我们 可 以 通过 记 下 第 一 次 
Select 语 名 中 的 ROWID 的 值 来 避免 这 次 查找 ， 并 政 善 性 能 。 填 面 的 Select 语 句 可 以 修改 如 下 
(ee.ROWID 人 代表 的 是 ORACLE 中 的 虚 列 ): 


exec sql select e.*, E.ROWID into :emprec. :mprid 


from empl oyee e where eid 一 :emptdval: 
变量 empria 上 店 明 为 一 个 18 字 节 长 的 字符 串 ( 一 个 19 字 节 长 的 字符 数组 ,包括 了 空 结束 符 ) 
这 样 ， 上 面 的 Update 语 名 可 以 修改 如 下 : 


exEC 59] Update employee Set taxcodte = 1 
where RONID = :emprid:; /i* perform update i 


在 2.3 节 中 的 关系 模式 的 规则 2 中 ， 我 们 规定 沁 录 只 能 按 内 容 来 检索 。 在 SQL 语 名 中 使 用 
ROWID 的 值 来 检索 很 明显 违反 了 这 条 规则 ， 但 是 它 被 很 多 数据 库 产 品 支 持 ， 黄 至 是 在 对 象 关 
系 语 法 中 填 加 了 RBF 能 力 之 前 。 从 表 中 取得 ROWID 的 值 是 很 有 用 的 ， 其 中 至 少 有 两 个 原因 : 

。 ROWID 的 值 可 以 用 于 查看 表 中 的 行 是 怎么 存储 在 磁盘 上 的 。 

* 通过 ROWID 来 访问 某 个 行 是 最 快 的 方法 。 

然而 ，ROWID 并 不 能 替代 表 的 主键 ， 因 为 如 果 是 很 入 以 前 存储 下 来 的 ROWID 的 值 ， 用 
它 来 访问 数据 可 能 就 是 不 合法 的 。 例 如 ， 许 多 类 型 的 数据 库 重组 织 可 能 会 引起 行 移动 到 男 外 
一 个 页 面 ， 因 此 使 得 原来 的 ROWID 的 值 不 能 再 被 使 用 。 这 时 ， 原 来 的 ROWID 的 指针 可 能 会 
指向 一 个 并 不 存在 的 行 ， 或 者 指向 了 占用 了 原来 页 面 地 址 的 新 行 。 由 此 引起 的 错误 可 能 是 毁 
灭 性 的 。 为 了 安全 起 见 ， 程 序 员 应 该 在 一 个 事务 内 部 使 用 ROW 了 JP 的 值 。 在 一 个 事务 内 部 可 以 
合法 地 使 用 ROWID 的 值 ， 因 为 系统 会 对 行 加 锁 ， 因 此 行 不 会 被 删除 或 者 进行 重组 织 。 值 得 注 
章 的 是， 这 种 情况 也 可 能 影响 对 象 关 系 中 的 REF 值 ; 在 表 进 行 重组 织 后 ，REE 的 值 可 能 也 会 变 
成 非法 的 。 
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为 外 一 个 ROWID 不 能 代替 表 的 主键 的 原因 是 。 不同 系统 之 间 ROWID 的 格式 是 不 同 的 ， 
而 且 不 问 系统 对 ROWID 的 支持 也 是 不 同 的 。 

行 是否 可 以 跨越 多 个 页 面 与 系统 有 关 

不 同 的 数据 库 产品 对 于 行 是 否 可 以 跨越 多 个 页 面 有 不 同 的 处 理 规 则 ,在 DB2 UDB 中 , 行 
的 地 大 长 度 不 能 超过 一 个 页 面 的 大 小 。( 对 于 一 个 4KB 的 磁盘 页 面 ， 最 大 的 行 长 度 是 4005 个 字 
节 ， 两 者 之 间 的 差 用 于 一 些 必须 的 磁盘 开销 。) 如 果 一 个 行 不 能 存 某 个 页 面 中 存放 得 下 ， 那 么 
DB2 UDB 会 把 行 移 到 一 个 新 的 正面 ， 然 后 在 原 米 的 页 面 中 插入 一 条 洲 出 记 东 (RID 指 外)、 然 
而 ，ORACLE 却 允许 行 勤 越 多 个 页 面 。 如 果 某 个 页 面 上 的 行 变 长 而 无 法 在 该 页 面 中 存放 时 ， 
那么 该 行将 被 分 草 成 片段 。 行 的 ROWID 值 保持 不 变 ， 在 原来 页 面 的 原 有 模 中 仍然 有 一 个 行 片 
段 ， 但 是 该 片段 的 末尾 指向 了 后 续 片 段 。 后 续 片 段 和 行 一 样 ， 在 -- 个 新 的 页 面 上 存放 在 某 个 
槽 中 ， 也 具有 一 个 ROWID 值 。 人 和 但是， 延续 片段 的 ROWID 的 值 是 不 能 被 任何 外 部 方法 访问 的 ， 
它 只 是 一 个 用 十 访问 跨越 多 个 奥 面 行 的 内 部 属性 。 如 果 发 生 了 多 次 分 割 ， 屠 么 原始 的 槽 中 将 
被 写成 指向 新 的 位 置 ， 面 不 是 存在 一 个 指针 的 链表 。 

很 有 明显， 如 果 可 能 的 话 ， 我 们 会 尽量 避免 分 段 的 行 的 出 现 。 分 眉 的 行 就 好 像 给 优 尔 泰 写 
信和 的 时 候 不 询 出 所 有 的 间 题 ， 而 是 说 当 你 收 到 回信 的 时 候 ， 会 把 后 画 的 问题 在 接 下 来 的 信 中 
所 出。 在 ORACLE 中 ， 可 以 使 用 Create Table 语 句 中 的 PCTFREE 子 句 在 页 面 上 空 出 尽量 多 的 空 
间 来 处 理 行 的 增 大 ， 从 而 使 行 片段 的 出 现 概率 减 小 。 但 是 ， 由 于 ORACLE 人 允许 行 跨越 多 个 页 
面 ， 因 此 在 下面 上 和 多留 可 用 空间 的 方法 并 不 是 一 个 一 般 的 解决 方法 。 而 在 PB2 UDB 中 ， 当 行 
太 大 时 ， 它 会 被 整个 移动 到 一 个 新 的 页 击 ， 由 于 RID 指 针 必 须 保留 在 原始 的 页 面 中 ， 所 以 仍然 
会 引起 片段 。( DB2 UDB 这 样 做 的 床 因 是 ， 避 免 修 改 所 有 指向 原始 行 位 址 的 索引 项 指针 }， 减 
少 片 段 是 需要 进行 数据 库 重 组 织 的 原因 之 一 。 


8.3 B 树 索引 结构 


B 树 是 一 种 键 探索 引 结 梅 ， 它 和 其 他 内 存 中 的 索引 结构 类 似 ， 例 如 平衡 二 叉 树 、AvL 树 、 
2-3 树 。 它 们 的 区 别 在 于 B 树 是 存 情 在 磁盘 上 的 ， 只 有 需要 访问 时 ， 此 些 项 才 会 被 调 人 内 人 存 中 。 
另外 -- 些 基于 磁盘 的 索引 结构 ， 例 如 散 列 表 (HASH )， 也 能 在 特定 的 应 用 程序 中 提供 高 效 的 
访问 速度 ,我 们 在 本 章 中 讨论 其 中 的 一 部 分 。 但 是 B 树 蚌 当 今 数 据 库 中 使 用 最 广泛 的 索引 结 
构 了 。 它 是 DB2 UDB 中 唯一 的 索引 结构 ; 在 ORACLE 中 ， 直 到 版 本 7， 也 是 系统 提供 的 唯一 的 
索引 结构 。 在 ORACLE 7 中 ， 新 增加 了 一 种 称 为 散 列 聚 艇 (Hash Ciuster) 的 索引 结构 。DB2 
UDB 认 为 B 树 提供 了 不 同类 型 索引 访问 的 灵活 性， 在 DB2 UDB 中 许多 特性 (例如 顺序 预 反 IO 
操作 ,将 在下 一 章 中 阐述 ) 使 得 DB2 对 许多 应 用 都 有 很 好 的 性 能 。 

下 面 的 章节 给 出 了 关于 了 B 树 的 索引 结构 的 进一步 介绍 。 在 定义 8.3.1 中 ， 列 出 了 B 树 的 重 
槛 特性 。 图 8-7 列 出 了 ORACLE 中 Create Index 的 语法 ， 该 索引 是 采取 B 树 实现 的 。 在 后 面 的 章 
他 将 介绍 ORACLE 提供 的 散 列 访问 以 及 Create Cluster 语 名 。 

后 面 , 我 们 还 会 讨论 关键 字 BITMAP;， 在 下 面 的 讨论 中 , 我 们 假设 BITMAP 关 键 字 不 存在 。 
在 图 8-1 中 的 X7Dpen 语 法 中 ， 第 二 行 中 的 圆 括号 中 的 列 名 列表 指定 了 组 成 特定 表 上 的 索引 键 的 


名 ”确切 地 说 ， 我 们 本 文 所 说 的 B 树 应 该 是 B+ 树 ， 它 是 B 树 的 一 个 变形 。 所 太 的 商业 产品 部 采用 B+ 罕 ， 人 本 是 ， 
通常 这 种 案 引 结 愧 被 简称 为 B 树 。 


i 


-名 8 于 二 下 39 


列 值 的 串 接 。 关键 字 ASC 1 DESC 实 际 上 没有 什么 效果 ， 因 为 在 索引 中 的 两 个 方向 上 很 容易 安 
排 。 执 行 ORACLE 的 Create Index 语 句 的 时 候 ， 会 在 命名 的 表 空 间 中 人 先 创建 一 片 初始 区 域 。 然 
后 对 应 于 表 中 的 每 - 行 都 会 插入 一 条 (keyval，ROWID) 形 式 的 索引 项 .这 些 索 引 项 将 按键 值 
排序 丰收 在 磁 贫 上 。 


{keyvall, RONIDI}, tkeyval2. ROWIO2), . . . ,， {keyvalH, ROWIONS., 


CREATE [UNIAUE | BITMAP] INDEX [schema.Jindexname ON [sthema. Jtablername 
tcolumname ASE | DESCT {, columnname [二 SP | DESCIIY 
LTABLESPACE tblspacename] 
[STORAGE 《TINITIAL n CKIM]] [NEXT n [KM]] LMINEXTENTS mn] [MAXEXTENTS nj 


[PCTINCREASE n] 1 J] 
[FCTFREE nM] 
Lother disk storage and transactional clauses not covered or deferred] 
ENOSORT] 





图 8-7 ORACLE 的 Create Index 语 全 的 语法 


所 以 在 排序 后 keyval1 和 过 keyval2 近 … 委 keyvalN。 在 第 9 章 中 ,我们 将 讨论 磁 胡 上 家 
引 项 的 排序 算法 ; 在 排序 阶段 ， 需 要 大 量 磁盘 空间 、 内 存 空 间 并 且 可 以 旧 求 CPU 和 磁 级 辟 的 
使 用 。TABLESPACE 和 STORAGE 子 句 以 辣 对 表 一 样 的 方式 决定 了 索引 的 磁盘 分 配 情 况 。 在 
和 解 了 B 树 索引 节点 分 布 情况 后 ， 我 们 再 讨论 PCTFREE 选 项 。 图 8-7 中 的 NOSORT 选 项 点 明 表 
中 的 行 已 经 核 索引 的 键 值 排 序 并 按 此 顺序 存放 在 磁盘 上 了 。 杀 此 可 以 通过 连续 访问 和 中 行 得 
到 升序 的 索引 项 ， 所 以 排序 步骤 花费 的 时 间 就 节省 下 来 了 。DRACLE 将 检查 键 值 是 否 真 的 按 
升序 排 济 ， 如 果 不 是 则 将 返回 一 个 错误 代 个。 


例 8.3.1 ”内存 数组 的 特殊 二 分 查找 法 ”在 以 前 的 数据 绪 构 谋 程 中 ， 读 普 可 能 已 经 学 习 卫 
二 分 查找 沙 。 但 是 这 里 给 出 的 特殊 算法 是 针对 已 经 排序 的 列表 中 含有 多 个 重复 值 的 情况 的 。 
在 非 唯一 索引 中 ， 这 一 算法 是 很 重要 的 。 

在 图 8-8 的 程序 中 ， 假 设 我 们 有 一- 个 ? 行 的 表 (可 以 推广 为 M )。 有 -- 个 类 似 于 索引 的 内 和 三 
中 的 排序 数组 arr [71， 因 此 {keyvalK，ROWIDK) 的 值 是 通过 arr[K-1] .keyval 和 
arr[K-1] .ROWID 给 定 的 ( 记 住 下 标的 范围 是 0 到 N-1 )。 如 果 arr [1] 数组 是 通过 keyva1l 来 
排序 的 ， 即 arr[0]】 .keyvalarr[1l] .keyval 守 ""… 守 arr[6] .keyval, 图 8-8 中 的 
binsearcn 函 数 实现 了 查询 最 左边 的 kevyvai = x 的 下 标 ， 其 中 x 可 能 有 重复 键 值 . 

假设 给 出 的 kevval1 值 序列 是 11 7, 7, 8,9,9, 10} ,下 标的 范围 是 0 到 6 如 办 x=1， 那 公 -.- 
分 查找 法 将 依次 检测 下 标 3、1、0， 最 后 算法 的 返回 值 是 0。 姻 果 x=7， 那 么 算法 将 依次 检测 下 
标 3、] ，0， 然 后 因为 arr[0] .keyval 不 等 于 7， 所 以 我 们 检测 arr11] .keyval， 发 现 它 
等 于 7 了 7， 所 以 算法 最 后 的 返回 结果 星 1， 如 果 x=8， 那 各 算法 将 依次 检测 3、] 、2， 返 回信 是 3。 
如 果 x=<9， 那么 算法 将 依次 检测 3，5，4， 并 返回 4 如 果 x=10， 那 么 算法 将 依次 检测 3、5、6， 
返回 值 是 6。 如 果 在 数组 中 有 重复 值 ， 那 么 binsearch 函 数 将 返回 使 得 x==arr Ik]keyva1 的 最 
小 下 标 k,,( 本 章 结 尾 的 对 题 中 有 一 道 题 是 要 求 读者 证 明 这 一 点 )}。 巾 使 得 binsearch 滑 数 其 有 车 
遍 性 ， 只 需要 : 把 7 替换 成 N， 而 m 的 值 要 满足 2”" 近 N< 2"， 而 probe 的 初 妨 值 为 2 - 1，dif 
的 初始 值 是 2””， 这 样 检测 proebe<= 6 或 者 probe +1 <= 6 就 变 成 了 检测 probe <=N - 1 和 Probe 
+l<=N—1, | 
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int binsearchtint x) 六 Feturn K sD that arrCKk], keywal =— x, or else -1 
in i no match: arr assumed to be external, dimension 7 is wired in 
{ 
int probe = 3, i:* start subscript K = 3 
diff = 2; /:* differente to 2nd probe 


while {diff > 0 4 js*# loop until kK to return 
if rprobe <= GB jh x > arr[iprobe] .keyval) A/* if probe too Tow 
probe = probe + diff: A* raise the probe position 


else /:* otherwise 
probe = probe 一 diff: . i* lower the probe position 
diff = diff/2: fw home in on answer, 
1 i We heave reached final probe = K 
if tprobe <= 6b BE x = BFrEprobe], Keyval} i have we Found x? 
return probe: /二 fF so, return K 
else if tprobe + 1 = 扯 
BE = arrLiprobetl | .keyval} rt might have undershot 
return probe + 1: i* then return this K 
plse return 一 ] : A* else, retirn faTflure 





图 8-8 包含 7 个 元 素 的 一 分 查找 法 


如 采 列 表 中 郊 素 的 个 数 为 N, 那 么 该 算法 的 循环 次 数 是 m - 1， 其 中 mm 是 满足 2” > N 的 最 小 值 (每 
个 对 应 一 个 出 在 十 ，di 在 的 取 值 是 从 2 到 2 )。 然 后 将 检测 最 后 的 prebe 值 ， 也 上 还 要 检测 prope+i 的 
值 。 为 一 种 方法 是 循环 次 数 是 mm 或 者 m - 1， 其 中 四 = CEILUog:(N))CEH(X) 晒 数 是 取 大 于 X 的 最 小 
整数 )。 虽然 我 们 可 以 证 明 它 几乎 是 最 有 效 的 查找 算法 ， 但 是 对 于 基于 磁盘 的 查找 来 说 却 不 是 最 优 
的 。 可 以 证 明 ， 如 果 我 们 对 磁盘 上 的 已 经 排序 的 列表 进行 二 分 查找 可 能 需要 更 多 的 IO 操作 。 


例 8.3.2 一 百 万 个 膏 引 项 的 二 分 齐 找 法 ”假设 表 中 有 一 百 万 行 ， 因此 在 有 序数 组 arr[ ] 中 
有 一 和 白 万 项 。 假 设 ROWID 需 要 占用 4 个 字 节 ， 键 值 也 要 占用 4 个 字 节 ( 这 是 对 于 整 型 键 值 而 言 ， 
如 果 对 于 字符 捉 索 引 键 可 能 需要 更 多 的 空间 )。 因 此 数组 中 的 每 -- 项 是 8 个 字 节 ， 一 个 2KB 的 
磁盘 页 面 最 儿 可 以 存放 2048/8 = 256 个 有 序 项 【忽略 额外 开销 )。 上述 的 二 分 查找 法 首先 检查 
2 -1 = 524 287 那 一 项 中 的 keyval 的 值 ， 与 x 进行 比较 ， 接 着 根据 比较 的 结果 向 左 或 者 向 右 移 
动 2"= 262 144 项 。 每 一 次 后 续 检 测 移动 的 距离 图 上 一 次 的 一 半 。 图 8-9 显 示 了 后 续 检 测 的 模式 ， 
即 每 一 次 以 前 一 次 检测 移动 距离 的 情况 。 


与 前 一 次 检测 值 的 差 检测 次 数 ”与 前 一 次 检测 值 的 益 


无 前 一 次 检测 4036 
262 144 2048 
131 072 1024 


6 3 512 
32 708 256 
16 38d : 128 
1 





图 8-9 1000 000 行 的 二 分 查找 的 probe 的 收 襄 中 高 
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育 到 第 13 次 ， 前 一 次 的 和 当前 的 probe 所 指 的 项 才 有 可 能 在 同 -- 个 页 面 土 。 困 为 每 一 个 页 
面 上 最 多 只 有 256 项 ， 所 以 前 12 次 中 ， 该 算法 都 是 不 停 地 在 不 同 页 面 之 间 来 回 切 换 。 如 果 我 们 
假设 访问 过 的 页 面 不 会 驻 留 在 内 存 中 ,那么 这 就 意味 着 我 们 至 少 要 作 12 次 LO 操作 1! 用 

我 们 可 以 使 用 B 树 来 对 二 分 法 查找 加 以 改进 。 

例 8.3.3 ”一 百 万 索引 项 的 B 树 结构 ”如 果 我 们 假设 每 一 页 上 有 ?56 个 索引 项 ， 那 么 一 共有 
CEIL(1 000 000/256) = 3907 个 页 面包 含 案 3| 项 。 这 些 和 包含 (Keyval, ROWID) 形 式 索 引 项 的 页 
面 ， 是 B 树 结构 中 的 叶 节 点 。 现 在 给 出 了 我 们 希望 定位 的 带 有 任意 键 值 x 的 项 ， 计 我们 创建 访 
问 止 确 叶 节点 最 有 效 的 目录 项 。 我 们 所 篇 要 的 是 指 疝 每 个 叶 节 点 的 指针 (一 个 页 面 号 ， 我们 
称 为 节点 指针 np ) 各 一 个 在 这 些 指针 之 间 的 分 隔 罕 键 值 。 图 8-10 给 出 了 这 种 结构 的 一 个 例子 。 
注意 ， 叶 节点 的 ROWID 的 值 没 有 画 出 。 


377 | 411 | 449 | 498 


图 8-10 指向 叶子 层 市 点 的 目录 结构 


在 这 样 的 目录 层 上 查找 一 个 指向 包 会 键 值 X 例 如 305) 的 叶 节 点 指针 ， 我 们 只 需要 找到 使 得 x 
<$1 的 最 左边 的 目录 分 了 噶 符 键 值 S 。 在 这 个 例子 中 ， 分 而 符 值 377 满 足 这 个 条 件 ， 所 以 我 们 可 以 
按 这 个 分 隔 符 键 值 的 左边 的 指针 找到 叶子 层 。 在 叶子 层 ， 我 们 可 以 使 用 一 般 的 查找 法 来 找到 该 
键 值 的 准确 位 置 。 因 为 在 叶子 层 有 3907 个 页 面 。 因 此 上 一 层 的 目录 节点 只 需 昌 3907 个 节点 指针 
和 用 来 区 分 包含 在 所 有 叶 节 点 中 键 值 范围 的 3906 个 分 隔 符 键 值 .我 们 假设 在 每 一 个 目录 项 ， 类 
似 于 叶子 层 的 索引 项 ， 包 含 了 一 个 指针 和 一 全 分 隔 符 键 值 np,sepkeyvai)， 因 为 目录 项 所 需要 
的 空间 和 叶子 项 所 需要 的 空间 差不多 ， 因 此 3907 个 索引 项 就 大 概 需 要 CEIL(3907/256)=16 个 页 面 ， 
我 们 称 其 为 B 树 的 索引 节点 或 者 目录 节点 。 下 一 步 ， 我 们 需要 创建 高 层 且 录 层 来 引导 我 们 到 达 我 
们 建立 在 叶子 层 之 上 的 目录 的 正确 索引 节点 。 我 们 可 以 使 用 同样 的 方法 ， 有 一 个 键 值 和 一 个 指 
向 子 他 点 的 指针 ， 在 这 一 层 节 点 中 我 们 只 需要 16 个 索引 项 。 这 个 数目 保证 在 一 个 页 面 中 就 可 以 
装 得 下 ， 我 们 称 它 为 B 树 的 椎 节 点 。 图 8-11 表 示 了 一 个 二 层 B 树 的 结构 ， 
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图 8-11 三 层 B 树 
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值得 注意 的 是 ，B 桂 是 倒立 的 树 ， 根 在 上 上面， 叶子 树 在 直面 。 我 们 把 所 有 叶子 层 以 上 的 节 
点 ,包括 根 节 点 ， 都 统称 为 目录 节点 或 者 索引 节点 。 根 节 战 以 下 的 髓 让 和 点 有 时 候 又 称 为 树 
的 内 节点 。 根 节点 是 B 树 的 第 一 层 ， 十 耐 节 点 的 层 号 依次 增 人 人 ， 而 叶 节 点 的 层 号 最大， 在 图 8- 
1 中 ， 叶 节 总 是 第 二 扶 。 叶 站 点 的 居 导 称 为 B 树 的 深度 。 为 了 找到 任 一 个 时节 点 ， 我 们 育 先 读 
大 根 节点 ， 然 厂 依 次 找到 下 面 各 层 的 上 日 录 页 和 面 ， 最 后 找到 我 们 所 宕 要 的 叶 节 点 。 然 后 在 叶 节 
点 中 查找 各 键 值 。 在 图 8-11 中 ， 我 们 只 需要 进行 三 次 WO 操作 就 可 以 访问 到 我 们 所 需要 的 项 ， 
比 上 面 需 要 13 次 IO 操作 的 一 百 万 项 的 二 分 查找 驱 少 得 多 。 

使 用 B 树 查找 比 二 分 查找 更 快 得 密 的 原因 在 于 B 树 可 以 得 到 每 个 读 出 磁盘 页 面 (B 树 和 节点 ) 
的 太 部 分 内 容 。 一 个 绅 妇 节点 页 面 上 的 所 有 项 者 包括 了 指 同 下 -- 层 和 点 的 指针 ，-- 共 可 以 指 
向 256 个 低 一 层 节 点 。 而 在 二 分 查找 中 ， 只 能 两 选 一 ， 结 所 只 有 同 个 节点 被 访问 。 因 此 如 时 我 
们 注意 -- 下 B 树 是 稠密 的 ， 而 二 分 法 查找 树 是 妖 蕊 的 。 我 们 选择 B 树 是 因为 -- 个 二 层 的 B 树 可 
以 访问 到 256 个 让 子 层 堵 引 项 。，B 和 树 有 256 个 户 出 ， 测 二 分 查找 仪 有 了 两 个 访 出 。 而 树 的 叶 并 点 
的 而 出 数 也 较 大 ， 每 :个 叶 节 点 都 有 256 个 ROWID 值 指向 被 索引 的 行 。 才 中 的 行 可 以 被 看 成 
是 位 十 B 树 叶 节 点 下 面 的 一 层 。 

如 采 我 们 恨 设 某 B 树 人 带 有 f 个 请 和 出， 我们 可 以 检测 CEILIIogECNJ) 次 琼 访问 叶 - 季 层 的 N 项 内 
此 如 果 朵 出 数 为 256, 我 们 可 以 通过 CBIL(iog:s(1 000 000))=3 次 检测 访问 到 1 000 000 个 叶子 项 。 
而 对 于 二 分 查找 ， 需 要 CEIL (log:(1 000 000) ) =20 次 检测 。 当 然 达 到 某 一 点 以 后 ， 二 分 当 找 
不 需要 页 面 VO 操 作 。 而 且 ， 在 B 树 的 情况 下 ， 对 于 每 一 个 索引 节点 都 需要 密 次 检测 才 可 以 得 
色 正 确 的 分 卫 符 键 值 米 访 问 下 一 层 。 伍 是 因为 我 们 要 最 小 化 的 是 CEO 操 作 的 次 数 ， 所 以 在 某 一 
节点 页 面 内 部 的 才 次 检测 是 不 计算 在 内 的 。 实 际 上 ， 对 于 一 个 经 党 使 用 的 B 树 而 音 ， 上 层 的 索 
引 节 点 是 经 常 被 访问 的 ， 面 且 在 所 有 的 数据 库 产品 中 都 有 如 图 8-2 甩 示 的 内 存 缓冲 区 ， 所 以 上 
县 页 面 很 有 可 能 就 驻 留 在 内 存 强 冲 区 中 ! 。 在 例 8.3.3 中 ， 上 两 层 一 共 才 17 个 页 面 ， 和 叶 节 点 
有 3907 个 页 面相 比 毕 帝 不 者。 把 所 有 索引 节点 放 在 级 神 区 中 是 以 把 UO 次 数 减 少 到 一 座 。 在 二 
分 查找 中 ， 我 们 通过 保留 31 个 驻 留 内 存 的 页 商 (31= 1 +2 +4 +8 +16) 米 截 前 12 次 检测 中 的 前 5 次 
检测 . 

1. 也 树 的 动态 修改 

革 面 我 们 讲述 的 是 如 何在 叶子 层 通 过 老 层 的 B 树 日 录 来 访问 索引 项 。 我 们 还 需要 知道 如 何 
进行 B 树 的 搬入 操作 ， 因 为 当 播 人 新 的 索引 项 时 ， 我 们 声明 B 树 是 -种 有 效 的 自修 收 络 构 。 当 
一 个 新 的 项 插 人 到 磁盘 上 的 有 序列 表 中 时 ， 为 了 给 新 搬 人 的 索引 项 空 一 个 位 置 需要 把 后 面 的 索 
引 项 都 依次 向 后 移动 ， 这 样 需 要 平均 移动 一 半 该 列表 所 存储 的 页 面 ， 如 些 点 用 程序 需要 进行 频 
繁 的 插曲 作 , 那么 这 种 方法 对 于 一 个 大 索引 将 率 就 太 低 了 。 和 在 例 8.3.3 中 .有 3907 个 叶子 页 面 ， 
我 们 需要 移动 这 些 页 面 的 -- 半 一 一 近 1953 个 页 面 读 ， 近 1953 个 页 面 号 一 一 如 有 果 我 们 不 上 黎 关 所 需 
的 数据 的 话 这 种 情况 必须 单独 发 生 。 如 果 每 秒 可 以 进行 80 次 TO 操作 ( 很 说 大 多数 页 面 不 存在 
于 内 存 缓冲 区 中 )， 那 么 需要 大 约 4000/80=50 秒 钟 〈《 人 惜 得 注意 的 是 ， 必 须 进行 4000 次 的 IO 操作 . 
速 庶 为 每 秒 80 次 MO。 结 果 的 单位 是 “LO 次 数 ” 除 以 “TO 次 数秒”， 所 以 最 片 的 单位 是 秒 。 在 
后 面 的 章节 中 ， 这 种 单位 之 间 的 计算 是 很 有 用 的 ， 将 会 被 经 常 使 用 到 这 秘 运 算 上 

基于 图 8-12 中 的 例子 ， 我 们 将 介绍 一 种 方法 ， 通 过 这 种 方法 当 在 叶子 层 上 插入 新 的 项 时 
能 保证 B 树 保持 平衡 ， 不 需要 更 新 过 多 的 页 面 。B 树 的 每 一 层 上 节点 都 不 能 是 “ 满 ” 的 【和 在 前 
备 我 们 鼻 设 节点 都 是 满 的 ， 每 一 个 页 面 上 有 256 项 )。 相 反 ， 人 尾 意 - 层 圭 都留 了 一 些 空间 ， 这 
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样 当 进行 插 人 操作 的 时 候 就 不 需要 申请 新 的 空间 了 。 当 要 捅 人 新 的 项 的 时 候 ， 我 们 将 根据 目 
冰 结 构 到 达 要 搬 人 的 项 所 在 的 叶子 真 面 。 当 插 人 完毕 之 后 ， 目 录 结 构 将 引导 我 们 到 达 新 项 键 
值 的 同一 叶 节 点 。 新 的 项 的 插 人 操作 总 是 发 生 在 叶子 层 ， 但 是 某 些 情况 下 ， 时 节点 已 经 太 满 
以 致 于 不 能 授 受 新 项 。 这 时 ,我 们 需要 把 该 叶 节 点 分 裂 到 两 子叶 子 页 面 ( 叶 当成 里 的 案 引 项 
是 排 了 序 的 ， 分 裂 后 的 左边 的 叶 节 点 包含 的 是 较 小 的 键 值 ， 右 边 的 叶 节 点 包含 的 是 较 大 的 键 
值 )。 这 意味 着 上 一 层 的 索引 节点 必须 修改 以 揪 人 新 的 分 陋 符 键 值 ， 另 外 偿 要 插 人 一 个 描 针 以 
指向 由 于 该 分 裂 产生 的 新 的 页 面 【 另 外 一 个 时 节点 使 用 原 有 的 页 面 )。 有 时 候 ， 插 人 新 的 分 隔 
符 键 值 和 指向 索引 的 下 一 更 高 一 层 的 指针 会 引起 索引 贡 扣 空间 不 够 ， 这 时 ， 我 们 需要 把 索引 
六 点 分 裂 ， 就 象 在 叶子 层 分 裂 叶 节 点 一 样 ， 并 修改 喝 高 一 层 的 节点 。 根 节点 层 也 可 以 播 人 新 
的 节点 ， 如 果 根 节点 也 需要 分 裂 的 话 ， 就 创建 一 个 更 高 层 的 节点 ,该 节点 的 指针 指向 诛 米 根 
节点 分 列 出 来 的 那 两 个 节点 。 
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现在 来 看 看 图 8-12。 我 们 假设 B 树 的 叶子 页 面 可 以 包含 三 个 索引 项 ， 而 不是 四 个 (这 比 实 
际 中 的 要 少 得 多 ,但 是 我 们 只 是 为 了 说 明 方 便 )。 我 们 也 假设 高 层 索引 节点 可 以 包含 三 个 节点 
指针 np ， 而 不 是 四 个 【三 个 节点 指针 应 该 只 有 两 个 分 柄 符 键 值 ， 但 是 这 里 我 们 假设 节点 指针 
个 数 和 索引 项 个 数 相 等 )。 这 种 结构 与 ?3-3 树 基本 相同 ， 是 一 种 驻 留 内 存 的 平衡 树 ， 在 很 多 数 
据 结 构 课 程 中 都 讲述 过 。 

开始 的 时 候 ，B 树 是 空 的 。 在 前 三 次 揪 人 中 , 我们 得 到 的 是 一 个 箔 单 的 结构 : 一 个 叶 节 点 ， 
同时 也 是 一 个 根 节 点 。 也 就 是 说 ， 不 需要 高 层 的 目录 项 ， 因 为 所 有 的 项 都 在 一 个 页 面 中 。 值 
得 注意 的 是 ， 我 们 没有 把 ROWID 的 值 显示 在 叶子 项 中 一 -假设 每 一 个 插 到 叶子 层 的 键 值 都 有 
一 个 相应 的 ROWID 值 。 高 屋 的 节点 项 都 有 节点 指针 np 指向 低层 的 节点 。 这 时 ， 我 们 在 B 树 中 
插入 键 值 39， 根 节点 就 需要 分 裂 ， 并 创建 一 个 新 的 根 节点 ， 该 根 季 点 有 两 个 指针 分 别 指 问 这 
现 个 低层 的 叶子 层 页 面 。 捣 后 ， 插 人 88 和 65， 又 产生 一 次 分 裂 ， 并 在 根 季 点 中 播 人 一 个 新 的 
分 隔 符 键 值 。 最 后 插入 62， 导 致 两 次 分 裂 。 第 一 次 是 叶子 节点 的 分 裂 ， 使 得 高 一 层 的 根 节 点 
中 播 人 一 个 新 的 分 隔 符 键 值 ， 从 而 导致 该 根 节点 也 分 裂 ， 并 创建 一 个 新 的 根 节点 。 

B 树 的 深度 只 有 当 分 席 根 节点 的 时 候 才 会 增加 。 根 节点 分 裂 后 ， 所 有 的 叶 节 点 的 深度 都 会 
增加 1。 很 明 最 不 可 能 存在 有 两 个 叶 节 点 的 深度 不 相等 的 情况 ， 所 以 B 树 任 然 是 平衡 树 。 

B 树 中 的 项 被 删除 来 响应 被 索引 的 表 中 被 删除 的 行 或 者 发 生 修 改 列 值 的 时 候 ，B 树 是 怎么 
样 变 化 的 呢 9" 如 果 我 们 考虑 图 8-12 中 的 最 终 形成 ， 假 设 在 叶子 屋 中 删除 键 值 为 62 的 项 ， 很 明 
显 有 -一个 叶 节 点 中 只 有 一 个 键 值 65。 我 们 发 现 该 节点 和 其 石 边 的 节点 - 共 只 有 三 个 索引 项 ， 
可 以 把 这 两 个 节点 侣 并 成 一 个 带 有 二 个 项 65 、88 和 56 的 节点 。 侣 并 之 后 ， 上 层 的 目录 层 节点 
就 不 需要 两 个 指针 ， 而 内 需要 一 个 指针 就 可 以 了 。 我 们 也 不 需要 分 也 符 键 值 55， 根 节点 十 的 
分 隔 符 键 值 55 就 可 以 了 。 现 在 考虑 一 下 ， 我 们 就 可 以 知道 在 目录 层 节点 怎样 进行 合并 (只 有 
一 个 节点 指针 ， 而 没有 分 隔 符 键 值 )。 节 点 处 的 分 并 符 键 值 必须 向 下 移动 到 人 台 并 的 节点 .以 区 
别 这 两 个 节点 指针 。 这 就 不 需要 根 节点 的 存在 ， 整 个 B 树 就 碱 少 了 一 层 ， 而 及 和 图 8-12 中 揪 人 
键 值 62 前 的 情况 类 似 了 (虽然 不 是 完全 一 样 ) 

有 一 个 算法 可 以 执行 上 面 描述 的 动作 ， 保持 B 树 是 平衡 的 而 且 根 以 下 的 节点 都 至 少 是 半 满 
的 。 但 是 很 少 有 商业 数据 库 产品 使 用 该 算法 。 合 并 节点 的 思想 有 点 复杂 ， 在 删除 的 时 候 需 要 
额外 的 WO 操作 。 大 多 数 的 数据 库 系 统 都 驳 许 在 不 需要 自动 地 重新 平衡 的 前 提 下 ， 减 少 节点 的 
个 数 。 如 果 酝 中 的 节点 变 空 时 ,该 节点 就 会 被 释放 ， 以 僵 一 个 右边 生长 左边 删除 的 索引 例 
如 一 个 日 期 /时 间 日 历 所 使 用 的 索引 ) 在 使 用 新 节点 的 时 候 释 放 旧 的 节点 (但 是 ， 从 DB2 UDB 
版 本 5 开始 ， 当 空余 空间 的 比例 有 利 寸 合并 的 时 候 ，DB2 UDB 就 会 支持 B 树 节点 的 合并 . 我 们 
将 在 讨论 图 8-15 中 的 Create Index 语 名 时 进行 详细 讨论 )。 

不 使 用 称 朴 索引 的 主要 原因 不 是 因为 磁盘 空间 【我 们 已 经 说 过 ， 磁 盘 是 很 便宜 的 )， 而 是 
对 分 布 在 大 量 叶 节 点 上 的 范围 查询 引起 的 科 盘 IO。 为 了 解决 这 个 效率 的 问题 ， 在 许多 数据 库 
产品 中 都 提供 了 对 B 树 进行 重组 织 的 实用 程序 。 这 种 实用 程序 能 复制 原始 索引 的 建立 过 程 ， 然 
后 产生 一 个 新 而 “于 兆 ” 的 B 树 。 在 下 面 的 章节 中 ， 我 们 会 介绍 一 些 其 他 的 磁盘 存储 需要 考虑 
的 事项 ， 例 如 可 用 空间 和 压缩 。 

2. 虽 树 的 属性 

定义 8.3.1 描 述 了 我 们 已 经 讨论 的 B 树 结构 。 这 个 定义 假设 键 值 可 以 是 变 长 的 ， 因 为 索引 刍 
可 以 是 变 长 的 列 值 。 许 多 定义 假设 的 是 固定 长 度 项 ， 但 是 在 实践 中 是 不 现实 的 。 这 个 定义 还 
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假设 当 分 玫 节 点 的 时 候 ， 分 怕 的 灰 右 节点 的 长 度 是 一 样 的 ， 但是， 某 些 产品 介 许 不 均匀 的 分 
裂 来 优化 记录 按键 值 升序 插入 的 情形 。 散 后 ， 该 定义 假设 当 有 项 被 删除 的 时 候 ， 会 对 B 树 进行 
重新 平衡 (通常 不 使 用 ， 这 在 前 面 已 经 解释 过 了 ),， 或 者 删除 操作 被 播 入 操作 压制 ， 所 以 所 有 
的 B 树 节点 中 包含 的 项 的 数目 都 会 增加 。 

定义 8.3.1 “B 树 (B- 树 ) 结 构 的 最 性 了 树 具 有 从 根 到 时 多 个 局 出 的 树 形 结 梅 ， 它 具有 下 列 
属性 : 

1) 每 一 个 节点 都 是 和 磁盘 页 面 大 小 一 致 ， 并 存放 在 磁盘 工 的 某 个 合适 位 置 。 

2) 叶子 层 以 上 的 节点 包含 目录 项 ， 有 n -1 个 分 隔 符 键 值 各 4 个 指向 下 一 层 B 树 证 点 的 磁盘 指针 。 

3) 时 子 层 上 的 节点 包 合 形式 为 (keyval，ROWID) 的 项 ， 指 同 被 索引 的 行 。 

4) 根 节 点 以 下 的 ， 所 有 节点 部 是 至 少 半 满 的 进行 多 次 删除 之 后 ， 可 能 会 不 满足 这 - … 条 
件 ， 除 了 DB2 UDB 外 ), 

5) 根 节点 至 少 有 阿 个 项 【除非 只 有 一 行 录 被 索引 并 且 根 节点 是 包含 一 个 (Keyval， 
ROWID) 对 的 时 节点 )。 面 

3. 索引 节点 布局 和 可 用 空间 

-- 个 普通 的 B 树 节点 页 面 有 很 简单 的 结构 。 赂 8-13 表 示 的 是 一 种 具有 了 唯 一 键 值 的 叶子 层 节 
点 的 可 能 布局 。 具 有 重复 索引 链 值 的 索引 通 向 会 对 重复 键 值 进行 压缩 ， 这样 号 能 在 一 行内 列 
出 所 有 能 在 一 个 叶子 页 面 中 存 得 下 的 、 具 有 同样 键 值 的 RID 值 ( 如 图 8-17 所 示 )。 值得 注意 的 
是 ， 具 有 可 恋 长 度 键 值 的 索引 也 对 应 于 可 变 长 度 的 项 ， 所 以 某 些 形式 的 “项 目录 ”会 在 图 8- 
13 中 的 节点 中 存在 ， 就 和 图 8-6 中 的 行 目 录 模 一至。 项 目录 也 提供 了 在 节点 中 进行 二 分 查找 的 
能 力 ， 即 使 键 值 是 可 变 长 度 的 。 


局 1 … ee 
B 树 项 


图 8-13 具有 唯一 键 值 的 B 树 叶 节 点 的 布局 


因为 在 B 树 的 生长 过 程 中 可 能 会 发 生 分 裂 。 所 以 随机 插入 后 ，B 树 节点 可 以 在 半 满 到 满 之 
间 随 机 变化 《 根 节 点 例外 ， 它 可 能 只 有 两 个 下 屋 节点 指针 项 )。 正 在 生长 的 B 树 中 的 根 层 以 下 
的 节点 的 平均 充满 程度 是 70.7%， 而 不 是 我 们 直觉 认为 的 75%%。 这 个 结果 可 以 从 数学 分 析 中 求 
得 ， 而 且 和 实验 结果 相符 合 。 这 个 百分率 对 除根 节点 以 外 的 所 有 节点 成 立 ， 这 个 结果 意味 着 
如 果 对 B 树 进行 大 量 的 随机 搬入 操 作 后 ， 先 前 对 于 100 万 行 而 估计 出 的 叶子 页 面值 过 低 。 

例 8.3.4 修改 后 的 一 百 万 个 索引 项 的 B 树 结构 和 例 8.3.3 一 样 ， 我 们 再 次 假设 一 个 索引 项 
的 大 小 是 8 个 字 节 ， 一 个 节点 页 面 的 大 小 是 2048 个 字 节 。 但 是 ， 现 在 我 们 假设 有 48 个 字 节 的 头 
信息 ， 根 层 以 下 的 节点 大 约 是 70 名 满 的 。 每 个 节点 上 有 1400 个 字 节 用 于 索引 项 ， 即 有 140018 = 
175 项 。 在 叶子 层 有 1 000 000 项 ， 这 就 意味 着 需要 CEIL(1 000 000/175)=$715 个 叶 节 后 负面 ， 
所 所在 更 高 一 屋 有 CEIL(5715/175)=33 个 页 面 节点 。 因 此 在 根 层 有 33 个 目录 项 ， 该 B 树 的 深度 
也 为 3。 在 本 章 和 下 一 澡 的 习题 中 ， 我 们 使 用 的 是 相当 粗略 的 计算 。48 个 字 节 大 小 的 头 信息 可 
能 对 于 特定 的 产品 是 不 对 的 ,但 基 这 只 是 一 个 糙 略 的 计算 而 已 。 
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的 数目 ，B 树 的 深度 就 近似 于 要 访问 到 时 节点 的 [MD 操作 的 次 数 ， 就 像 我 们 前 面 说 过 前 一 翌 ， 
前 党 我 们 估计 每 层 的 扇 出 数 为 na， 这 里 n 是 每 个 节点 中 出 现 的 项 数目 . 假设 根 节点 和 下 面 各 屋 
节点 的 日 录 项 数 自 是 n， 那 么 第 二 屋 中 项 的 数 旭 是 n ,第 三 屋 中 项 的 数目 是 it, 依次 类 推 。 如 果 B 
树 的 深度 是 K， 奢 么 在 根 节点 分 裂 之 有 前， 叶子 层 中 项 的 总 数 为 a" 反 过 来 ， 如 果 想 创建 一 棵 包 
舍 M 行 的 B 树 ,那么 该 B 树 的 层 数 kK 是 : 

K = CEIL(og,.(MY 

内 此 ， 择 的 深度 和 行 的 数 日 是 对 数 的 关系 。 而 持 的 深度 K 就 是 查找 叶子 性 键 值 所 第 要 的 
VO 棵 作 的 坎 数 。 但是， 事实 证 明 这 两 个 说 法 容易 令 人 人 误解。 因为 有 内 存 缓冲 区 ， 那 些 经 常 使 
用 的 B 树 的 上 上面 几 层 节 点 都 存放 在 缓冲 区 中 (我 们 不 关心 那些 不 经 常 使 用 的 B 树 的 访问 效率 )。 
通常 ， 深 度 为 3 的 B 树 使 所 有 叶子 屋 以 上 的 凶 点 者 在 内 存 缀 溃 区 中 。 但 是 很 少 有 叶 于 屋 节 点 是 
存放 在 内 存 缓 冲 区 中 的 ， 因 此 查找 叶子 层 键 值 的 实际 的 VO 操作 的 深 数 应 该 是 1。 同时， 树 的 
深度 和 和 行 的 数 日 是 对 数 关 系 这 一 说 法 也 容易 令 人 误解 ， 因 为 树 的 扁 出 很 大 ， 将 不 能 赁 直觉 得 
到 。 人 在 例 8.3.4 中 假设 ， 每 个 节点 中 项 的 平均 数 日 是 175， 也 就 是 n 的 值 ， 忽 酷 根 节点 处 项 的 数 
日 可 能 会 大 一 些 这 一 事实 ， 这 就 意味 着 一 棵 有 商 层 的 B 树 紧 进 行 根 节点 分 像 的 时 候 ， 在 叶子 层 
包含 了 175=30 625 项 。 如 果 一 棵 深度 为 3 的 B 树 直到 有 175 = 5 359 375 项 时 才 会 有 根 节 点 分 烈 。 
这 就 提供 了 足 铝 索引 500 万 行 形 的 项 ,所 以 很 少 使 用 超过 三 层 的 B 树 .而 175 的 值 达到 了 937 890 625， 
所 以 表 中 行 表 的 项 数目 要 达到 近 十 亿 才 需要 五 层 的 B 树 。( 当然 如 果 键 值 的 长 度 很 长 ， 每 一 页 中 包 语 
的 项 的 数目 会 少 .- 些 ， 所 以 较 少 一 些 的 行 就 可 能 要 五 谋 的 B 树 六 

在 大 多数 数据 库 产品 中 的 表 上 创建 一 个 索引 时 ， 最 高 效 的 方法 是 首先 装载 带 有 一 些 初始 
的 行 的 表 ， 然 后 再 创建 索引 .这样 慨 的 优点 证 于 Create Index 首 先 取 出 索引 项 ， 然 后 按键 值 排 
序 ， 最 后 把 排序 后 的 项 加 到 B 树 的 叶子 层 中 的 过 程 是 非常 高 效 的 。B 树 中 的 所 有 节点 是 按 以 左 
到 右 装 载 的 ， 所 以 后 续 的 插入 棵 作 通 常 发 生 在 辣 一 个 叶 节 点 ,这样 就 能 保证 在 内 存 绥 溃 区 中 
是 连续 分 布 的 。 当 叶子 节点 分 列 的 时 候 ， 后 续 的 叶 节 点 是 从 下 一 个 磁 玲 页 面 上 分 配 的 。 每 一 
层 的 节点 在 这 种 控制 方式 下 分 裂 ， 而 且 人 允许 我 们 在 每 一 个 页 面 上 都 留 有 正确 的 可 用 空间 。 另 
一 方面 ,在 Create Index 语 句 后 质 人 行 的 时 候 ， 通 常会 引起 B 树 在 叶子 层 随 机 插 人 人， 这样 就 需 
要 更 多 的 TO 操作 次 数 (因为 叶 节 点 不 存放 在 内 存 缓 冲 区 中 ) 和 随机 的 节点 分 裂 。 因 此 先 装 载 
记 菜 、 然 后 在 上 面 创建 索引 比 先 创建 案 引 、 然 后 在 装载 数据 的 效率 要 高 . 

4. ORACLE 和 DB2 UDB 的 Create Index 语 向 

一 旦 创建 后 ，B 树 很 有 可 能 保持 不 变 。 这 种 情况 发 后 在 表 上 的 索引 保证 了 没有 新 的 行 插入 
或 者 影响 被 索引 的 询 的 更 新 。 如 果 不 会 对 B 树 进行 修改 ， 我 们 可 以 让 B 树 所 有 的 节点 都 装 满 。 
但 是 ， 如 果 有 可 能 会 插入 了 新 的 项 ， 让 所 有 的 节点 都 装 满 显 然 是 一 个 筷 态 的 想法 。 搬 人 少量 
的 新 行 就 会 引起 天 量 的 初始 节点 分 裂 【需要 大 其 的 IO 和 CPU 时 间 )， 结 果 是 市 点 的 个 数 迅 速 
淹 和 看 ， 但 是 最 后 每 个 节点 都 几乎 只 有 半 满 ， 从 而 导致 资源 的 大 量 浪费 。 在 大 多 数 数据 库 系 统 
中 ， 我 们 可 以 控制 B 树 开始 创建 的 时 候 节点 满 和 的 程度 。 图 8-14 重 复 了 图 8-? 中 表述 的 语法 ,在 
图 8-14 中 通过 ORACLE 的 Create Index 语 句 中 的 PCTFREE 子 句 说 明了 这 一 点 。 

PCTEFREE 子 句 中 0 的 值 可 以 从 0 到 99 ， 这 个 数字 决定 了 当 索 引 第 一 次 创建 的 时 候 ， 每 个 B 
树 节点 页 面 { 在 ORACLE 中 称 为 块 ) 将 不 被 填充 的 百分比 。 这 个 空间 用 于 当 插 人 新 行 的 时 息 
那些 新 的 索引 项 的 捅 人 。PCTFREE 的 缺 省 值 是 10， 该 值 越 大 允许 在 全 点 分 腊 前 能 揪 人 的 行 越 
多 。 在 图 8-15 中 ， 我 们 可 以 看 到 DB2 UDB 中 使 用 的 类 似 的 一 个 参数 。 事 实 上 ，ORACLE 一 下 
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都 保持 和 DB2 UDB 语 法 的 兼容 性 ， 因 此 我 们 可 以 认为 磁 表 存储 结构 没有 什么 这 别 的 时 候 ， 命 
名 约定 是 一 致 的 ， 


CREATE [UNIGUE | BITMAP] INDEX [schema. lindexrame ON [schema,]tablename 
columnname [AS | DESC] {, Folumnname [ASC | DEFESC]T 
[TABLESPEACE tblspacename] 
[STORAGE {LINITIAL n CK|IMIY LNEXT rn [KEIMY] CMINEXTENTS n] [HAXEXTENTS n] 


LPETINCREASE nl ) ] 
[FCTFREE nm] 
[other disk storage and transactional clauses not covered or deferred] 
[NOSORT] 





岗 8-14 ORACLE 的 Create Index 语 句 的 语法 { 傅 有 PCTFREE 子 条 ) 


CREATE [UNIQUED INDEX indexname ON tablename 
(columnname [ASC | DESCY {, tolumnname [ASC | DESC]Y?} 
LINCLUDE tcotumnname [Ast | DESCY (, columnname [LASC | DESC]}}] 
[tLUSTER] 


[PCTFREE n] 
[MENPETUSED nj 
[ALLOW REVERSE SCANS]: 





图 8-15 DB2 UDB 的 Create Index 庄 句 的 语法 


图 8-15 中 的 DB2 UDB 的 Create Index 语 名 缺少 了 了 ORACLE 中 的 TABLESPACE 子 名 ， 因 为 在 
DB2 UDB 中 索引 使 用 的 表 空 间 和 和 表 所 使 用 的 表 空 间 是 一 样 的 。( DB2 UDB 的 Create Table 语 名 
在 语法 上 和 我 们 上 面 讨论 的 基本 SQL 形 式 一 致 )。INCLUDE 子 名 可 以 和 UNIQUE 索 3 引 一 起 用 
来 指定 除了 索引 键 以 外 的 、 索 引 中 可 以 存储 的 列 。 这 些 列 可 以 通过 INDPEXONLY 查 询 来 很 快 
地 访问 到 ， 这 种 查询 不 需要 访问 任何 表 的 行 。 关 键 词 CLUSTER 将 利 聚 簇 索引 一 起 说 明 。DB2 
UDB 中 的 PCTFREE 了 于 名 和 和 ORACLE 中 的 会 六 是 一 样 的 。MINPCTUSED 子 名 设置 了 一 个 阅 值 ， 
当 删 除 的 行 以 后 达到 这 个 盖 值 ， 页 面 就 会 合并 。ALLOW REVERSE SCANS 子 句 (在 DB2 
UDB 版 本 6 中 新 引进 的 特征 ) 创建 了 一 个 双向 叶子 指针 ， 能 让 查询 优化 器 在 两 个 方向 上 都 能 进 
行 扫 描 。 当 做 指定 范围 检索 的 时 候 ，DB2 UDB 能 非常 有 效 地 使 用 连续 磁盘 存储 ， 所 以 尽 可 能 
让 叶子 节点 在 磁盘 上 连续 存储 是 非常 重要 的 。 我们 会 在 8.4 节 和 第 9 章 中 详细 曾 述 这 一 -点 。 

5. 索引 中 前 重复 键 值 

我 们 已 经 讨论 了 很 多 关于 B 树 的 问题 ， 我 们 并 没有 假设 键 值 必 须 是 唯一 的 。 在 例 8.3.1 中 讨 
论 二 分 查找 法 的 时 候 ， 我 们 考虑 了 重复 键 倩 的 可 能 性 ， 并 提供 了 在 重复 集合 中 找到 最 左 键 值 
的 算法 。 在 图 8-12 中 ， 仿 次 插 人 了 B 树 的 键 值 是 7.96,.41,39,88,6$,55.62， 这 些 键 值 没 有 重复 值 ， 
但 是 看 看 这 张 图 最 后 B 树 形式 ， 我 们 可 以 很 简单 地 想象 怎么 样 搬 人 一 个 重复 键 值 88。 首 先 找 到 
第 一 个 满足 88 志 5,， 然 后 按 左 边 的 np 指针 达到 含有 G2 和 65 的 叶子 节点， 然后 把 88 插 到 这 个 叶 
节点 中 。 现 在 两 个 键 值 88 的 项 的 ROWID 有 不 同 的 ROWID 指 针 。 键 值 和 ROWID 指 针 一 起 用 于 
区 别 不 同 的 索引 项 。 

如 果 现 在 我 们 再 插 人 键 值 88 的 另 一 行将 发 生 什 么 情况 呢 ? 这 行 对 应 的 新 的 项 将 插入 到 与 
前 一 个 候 同 的 叶 了 于 页 面 中 ,使 得 这 个 叶 节 点 中 有 四 项 : 62，65 和 两 个 88.。。 因 为 叶子 层 入 点 不 
能 包含 超过 三 个 项 ， 所 以 该 节点 分 型 成 两 个 ， 左 边 的 那个 包含 62 和 65， 和 右边 的 那个 包含 两 个 
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88。 这 就 意味 着 在 上 层 节 点 中 要 新 增加 一 个 分 隔 符 键 值 88 ， 如 图 8-16 所 示 ， 





图 8-16 有 和 多 个 重复 键 值 的 B 树 结构 


使 用 两 个 同样 的 分 隔 符 键 值 88 似 和平 有 此 奇怪 ， 而 且 这 个 键 值 并 不 能 区 别 下 层 最 右边 的 两 
个 叶 节 点 【这 两 个 节点 中 都 包含 键 值 88 )。 因 此 系统 在 处 理 查询 的 时 候 必 须 考虑 到 这 一 点 ， 而 
实际 上 也 的 确 考虑 到 了 这 一 点 。 特 别 地 ， 当 要 检索 所 有 键 值 等 于 88 的 行 的 时 候 ， 系 统 在 索引 
层 查找 分 陋 符 键 值 大 于 等 于 88 的 最 左边 的 那 一 项 。 当 然 我 们 找到 了 分 阐 符 键 值 88， 而 且 因 为 
我 们 多 计 有 重复 键 值 ， 所 以 讲 该 键 值 左边 的 指针 np 向 下 的 那个 叶 季 点 中 ， 也 有 可 能 有 键 值 88。 
在 这 种 情况 下 没有 如 果 我 们 有 唯一 索引 的 话 ， 我 们 可以 查找 分 隔 符 键 值 大 于 88 的 最 左边 的 
那 一 项 ， 如 果 该 键 值 存在 的 话 ， 总 能 找到 正确 的 节点 )， 当 我 们 到 达 了 叶子 屋 ， 我 们 读 出 所 有 
含有 键 值 88 的 项 ， 从 一 个 时 节点 到 下 一 个 叶 节 点 。 这 种 检索 重复 键 值 的 方法 很 容易 推广 为 给 
定 范围 的 检索 (例如 找 出 键 值 在 88 和 120 之 间 的 行 ) 为 了 使 得 这 种 在 叶子 层 的 顺 主 查找 能 方 
便 地 进行 ， 时 闻 点 通常 有 指 疝 它 的 后 续 兄 第 节点 的 指针 (也 有 可 能 存在 指向 前 而 匈 帝 节 点 的 
指针 ， 用 于 那些 降序 查找 的 Select 诸 句 中 )。 

现在 我 们 考虑 一 下 如 果 当 重复 键 值 88 的 个 数 到 达 一 定数 目 ， 从 而 需要 在 日 录 层 以 上 包 合 
两 个 分 隔 符 键 值 的 情况 。 只 要 我 们 的 搜索 算法 保证 能 正确 地 在 叶子 层 找 到 最 左边 的 那 一 项 就 
可 以 了 ， 即 总 是 沿 最 左边 的 目录 指针 向 下 查找 。 我 们 仍然 可 以 使 用 从 最 左边 开始 、 依 次 检索 
出 具有 相同 键 值 后 续 项 的 方法 。 但 是 ， 当 我 们 要 删除 具有 键 值 88 的 行 的 时 候 ， 就 出 现 了 一 个 
很 有 趣 的 和 情形。 为 了 正确 删除 该 行 ， 它 所 对 应 的 B 树 的 叶 层 相关 项 也 要 删除 ， 否 则 就 会 有 一 个 
索引 项 指向 一 个 并 不 存在 的 行 。 因 为 该 项 没有 被 其 键 值 唯一 标识 ， 所 以 系统 可 能 要 读 出 所 有 
具有 该 键 值 的 项 ( 可 能 需要 读 多 个 页 而 ) 来 检索 具有 将 被 删除 的 行 的 ROWID 值 并 所 键 值 等 于 
88 的 项 。 可 以 使 得 同一 键 值 的 项 按 RDOWID 的 值 进 行 排 序 ， 并 使 得 日 录 分 隔 符 值 中 也 包含 
ROWID 的 信息 。 因 为 分 隔 符 中 包含 有 唯一 的 ROWID 前 级 值 ， 所 以 分 隔 符 是 唯一 的 ， 对 于 会 
有 键 值 88 和 指定 的 ROWID 值 的 行 ， 可 以 通过 B 树 很 快 地 检索 到 . 但 是 ， 这 种 方法 并 没有 在 某 
些 商业 数据 库 产品 中 实现 。 删 除 一 个 对 应 于 多 个 重复 键 值 的 行 ， 可 能 需要 在 B 树 的 叶子 层 上 进 
行 一 次 较 长 的 查找 过 程 。 

过 引 RID 列 表 

对 于 重复 键 值 ， 我 们 可 以 在 上 叶 节 点 使 用 合适 的 方法 来 节省 空间 。 内 为 对 于 大 量 的 行 问 一 
个 键 值 可 能 重复 多 次 ， 对 于 一 个 长 的 ROWID 值 列表 我 们 可 以 一 次 只 列 出 唯一 一 个 键 值 。 因 为 
键 值 有 时 候 是 很 长 的 字符 叫 ， 而 ROWID 的 长 度 却 较 短 。 这 就 可 以 在 检索 时 市 省 大 量 的 MO 时 
间 。 在 DB2 UDB 中 ，ROWID 被 称 汶 RID，B 树 索引 的 叶 节 点 有 不 同 的 形式 ， 依 赖 于 键 值 是 唯 
一 的 还 是 有 多 个 重复 值 。 如 果 键 值 是 唯一 的 ， 那 么 叶 节 点 的 布局 和 图 8-13-- 致 。 如 果 有 重复 
键 值 ， 那 么 时 节点 和 图 8-17 一 致 。 

我 们 可 议 看 到 ， 如 果 有 重复 键 值 ，DB2 UDB 中 键 值 只 出 现 一 次 .后 而 息 一 个 RID 值 的 列 
表 ( 在 后 面 我 将 其 称 为 RID 列 表 或 ROWID 列 表 )。 在 DB2 UDB 中 ， 在 不 同 的 RID 列 表 块 的 最 前 
而 有 一 个 2 个 字 节 的 前 级 ， 在 图 8-17 中 表示 为 Prx。 这 个 块 前 缀 包含 了 抽 辑 块 的 长 度 ， 这 样 重 
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复 键 值 的 个 数 就 可 以 确定 了 。 每 一 个 块 中 的 RD 的 值 最 和 多 可 以 有 255 人 个， 但 是 可 以 创建 一 个 有 具 
有 相同 键 值 的 后 续 块 。 如 果 我 们 假设 键 和 值 是 10 字 节 的 字符 串 ， 每 -一 个 唯一 键 占 用 14 个 字 节 
(KeyvalL+RID 的 长 度 )， 那 么 100 个 唯一 键 就 需要 占用 1400 个 字 节 。 另 一 方面 ，100 个 重复 项 
需要 占用 2+10+100 x 4=412 个 字 节 ( Prx 的 长 度 +keyval 的 长 度 +100 个 RID 的 长 度 )， 从 而 节 
省 了 太 量 空间 。 很 明显 ， 当 重复 个 数 增 加 的 时 候 ， 叶 子 层 索引 需要 的 空间 主要 就 是 RID 值 所 需 
要 的 空间 。 


图 8-17 在 不 同行 有 重复 键 值 的 PB2 UDB 的 时 节点 的 布局 





6. ORACLE 的 位 图 索引 

我 们 记得 在 图 8-7 中 的 ORACLE 的 Create Index 索引 有 一 个 关键 词 BITMAP。 如 果 有 多 个 行 
有 重复 键 值 的 时 候 ， 就 可 以 使 用 位 图 索引 kbit map indexj 了 。 例 如， 我 们 假设 定义 了 售 有 100 
000 个 雇员 的 表 : 


create table emps teid char(s) not nyull primary key, ehame varchart16), 
mgrid charis}y references emps, gender charcl},. salarycat smallint, 
dept charts}): 


这 个 表 的 主键 列 eid 自 动 其 有 唯一 索引 。 因 为 每 一 行 都 有 一 个 唯 -一 的 eidq 键 值 ， 所 以 在 该 
列 上 使 用 位 图 索引 基 不 合适 的 。 事实 上 ， 图 8-7 中 的 语法 允许 使 用 可 选 的 UNIQUE 或 者 
BITMAP， 但 是 两 者 不 能 和 痊 时 使 用 。 荔 一 方面 ， 列 gender( 值 为 'M' 或 者 F')、salarycat 
【 值 从 1 到 10 } 和 dept (有 12 个 秆 ， 从 'ACCNT' 到 'SWDEY') 的 人 秆 的 个 数 都 很 少 ( 这 被 称 为 这 
些 列 的 集 势 较 小 )。 因 此 ， 我 们 希望 这 些 列 的 特定 的 键 值 有 大 量 不 同 的 ROWID 值 ， 这 些 列 适 
合 创 建 位 图 索引 ， 


create Ditmap index genderx on empsfgender ) ; 
create bitmap index salx on empstsalrycat): 
create bitmap index deptx on empstdept): 


现在 我 们 来 介绍 位 图 索引 的 思想 。 有 N 个 行 的 表 中 每 一 行 都 有 一 个 原始 编号 , 依次 是 0 ,1， 
2，-…，N - !。 连 续 编 号 的 行 ， 厅 论 在 什么 情况 下 ， 在 磁盘 上 都 是 物理 连续 的 ， 而 且 一定 有 -~- 
个 函数 能 进行 原始 编号 到 ROW 芒 的 转换 。 而 仔 图 是 一 个 有 N 位 的 序列 { 每 一 位 的 值 是 0 或 者 1 ， 
8 位 基 一 个 字 节 )}， 位 其 能 表示 任何 一 个 ROWID 的 列表 L: 如 果 原 始 编 号 为 k 的 ROWID 值 在 列 
表 L 中 ， 那 么 N 位 位 图 的 第 位 被 设置 为 1， 否 则 就 被 设置 为 0。 人 出 如 ， 位 图 
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表示 的 是 原始 编号 为 0，3，5，9，10， 12，13，15，… 的 ROWID 的 列表 L。 每 一 个 位 图 都 代 
天 了 在 B 树 中 一 个 键 值 所 对 应 的 排序 了 的 ROWID 列 表 。 因 此 ， 某 一 列 的 位 图 索引 有 该 列 上 每 
个 值 的 一 个 位 图 。 册 如 表 emps 的 adept 列 上 的 位 图 索引 是 一 个 普通 的 B 树 ， 该 索引 的 每 一 个 键 
值 有 一 个 相应 的 ROWID 列 表 ， 只 是 这 里 我 们 使 用 的 是 位 图 (如 图 8-18 所 示 )， 而 不 是 图 8-17 中 
使 用 的 ROWID 列 表 。 值 得 注意 的 是 ， 就 像 DB2 UDB 把 图 8-17 中 的 RID 列 表 分 割 成 逻辑 块 一 样 ， 
ORACLE 把 位 图 分 割 成 可 以 在 磁盘 页 面 上 存储 的 段 。 很 明显 ， 一 个 有 100 000 行 的 表 上 的 位 图 
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将 有 100 000 个 位 ， 也 就 是 100 000/8=12 500 个 字 节 ， 这 就 需要 占用 至 少 7 个 2KB 大 小 的 页 面 。 
emps 表 上 aeptx 索 引 的 B 树 根 节 点 


[TEST 





图 8-18 emps 袁 的 aspt 列 上 的 位 图 索引 


(1) 位 图 的 密度 

如 采 位 图 中 1 的 比率 较 大 ， 那 我 们 束 称 该 位 图 是 稠密 的 。 位 图 的 密度 定 尽 为 位 图 中 为 1 的 
位 的 个 数 除 以 位 图 的 所 有 位 的 个 数 N。 如 果 某 列 上 有 32 个 值 . 那么 每 个 值 的 平均 密度 就 是 1/32 
《这 是 原始 编号 为 k 的 记录 在 该 列 上 只 有 一 个 值 ， 所 以 在 位 图 索引 的 其 中 一 个 位 图 的 第 k 个 位 署 
为 1 }。 因 为 如 来 有 32 个 键 值 ， 位 图 索引 所 需 空间 就 和 DB2 UDB 的 RD 列表 索引 一 样 ， 对 每 个 
RID 都 需要 32 位 ， 即 4 个 字 节 (需要 一 些 额外 的 空间 用 于 存储 键 值 ， 在 位 图 索引 中 也 需要 这 些 
空间 ) 但 是 ， 如 二 列 上 有 320 个 值 ， 那 么 对 应 的 位 图 个 数 就 是 32 个 什 所 对 应 位 图 个 数 的 10 
人 税 ; 每 一 个 位 图 所 需 的 大 小 和 32 个 值 时 是 一 样 的 。 这 时 ， 每 一 个 位 图 的 平均 密度 就 降 到 1/320， 
那么 位 图 案 引 的 大 小 就 和 列 值 的 个 数 成 比例 。 但 是 对 于 任何 数 自 键 值 的 RID 列 表 索 引 ， 它 总 是 
有 相同 个 数 的 RID。 如 果 RID 的 个 数 比 键 值 的 个 数 要 儿 ， 它 的 大 小 仍然 保持 不 变 ， 所 以 键 值 的 
长 度 只 是 RID 长 度 的 一 小 部 分 。 

如 采 位 图 的 审 度 较 小 ,那么 我 们 称 位 图 是 大 节 的 。 当 有 太 量 键 值 的 时 候 ， 由 于 这 种 笑 玖 
索引 位 图 索引 所 占 磁 杷 空间 的 大 小 就 比 RID 列 表 索 引 所 亩 机 副 空 间 的 大 小 疡 大 得 多 。 但 是 
ORACLE 用 一 个 特别 的 算法 来 还 编 位 图 案 引 中 的 稀 路 位 图 ， 从 而 减 修 位 图 索引 的 大 小 。 例 如 ， 
通过 类 似 于 ROWID 列 表 所 提供 原始 编号 列表 的 方法 ， 稀 朴 列 表 可 以 被 压缩 。 很 明显 在 密度 是 
1/320 的 位 图 中 ， 这 样 ， 可 以 节省 大 量 空 间 。OQRACLE 有 这 一 算法 更 有 效 的 压缩 算法 。 为 了 说 
明 压 缩 的 有 效 性 ， 我 们 举 个 例子 ， 如 果 每 一 个 键 值 都 只 有 两 行 (~- 个 相当 确 玻 的 位 图 !1 )， 压 
缩 后 的 位 图 索引 比 RID 列 表 索 引 还 要 小 。 键 值 个 数 越 小 ， 压 缩 的 位 图 索引 的 优点 就 越 明 显 ， 直 
到 位 图 的 密度 足够 大 了 而 不 需要 对 位 图 索引 进行 压缩 。 在 下 面 的 讨论 中 ， 我 们 称 未 被 压缩 的 
位 图 为 “ 逐 字 逐 自 的 住 图 ”( Verbatim Bitmap )， 以 区 别 于 压缩 了 的 位 图 。 

(2 位 图 索引 的 优 缺 点 

和 传统 的 RID 列 表 索 引 相 比 ， 使 用 位 图 索引 至 少 有 两 个 性 能 上 的 优点 。 第 ~， 位 图 索引 有 
很 好 的 VO 性 能 ， 因 为 压 第 后 的 位 图 比 ROWID 列 表 索 引 需 要 更 少 的 空间 。 第 二 ,位 图 索引 在 
执行 表示 在 位 图 索引 上 的 两 个 谓词 之 间 的 布尔 操作 【 例如 与 和 或 ) 的 时 候 有 很 好 的 性 能 。 举 
个 例子 ,假设 我 们 要 回答 如 下 这 一 查询 ， 

select eid from emps where salarycat = "10° and dept = “ADMIN": 

如 果 WHERE 子 名 中 的 两 个 列 属 性 都 有 一 个 位 图 索引 ， 那么 两 个 相等 谓 闪 将 每 一 个 都 对 应 
于 位 图 索引 中 的 一 个 位 图 。 采 用 这 种 方式 进行 两 个 谓词 之 间 的 AND 操 作 要 比 在 传统 的 ROWID 
列表 索引 上 进行 要 有 效 得 多 。 而 且 ， 这 个 优点 对 于 压缩 位 图 索引 一 样 存在 ，WHERE 了 于 名 中 出 
现 的 谓词 越 多 就 越 有 效 。 另 外 预先 定义 的 特殊 类 型 的 位 图 索引 在 执行 大 多 数 普 通 类 型 的 连接 
操作 以 及 外 键 到 主键 的 连接 操作 的 时 候 很 有 效 。 在 进行 大 量 复杂 查询 的 时 候 ， 位 图 索引 经 芝 
镇 使 用 。 
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双 一 方面 ， 如 朱 对 表 进 行 大 量 的 影响 位 图 索引 的 更 新 操作 的 时 候 ， 位 图 索引 就 有 缺点 了 . 
位 图 索引 可 以 适应 表 上 的 更 新 、 插 人 和 删除 操作 ， 但 是 修改 操作 并 不 能 很 容易 执行 。 特 别 是 
当 位 图 索引 被 压缩 以 后 ， 因 为 位 图 必须 先 解 压缩 ， 然 后 再 进行 修改 。 国 为 这 个 缺点 ， 如 果 表 
上 要 进行 大 量 的 更 新 操作 的 时 候 ， 通 常 不 使 用 位 图 索引 。 


8.4 聚 徐 索引 和 非 聚 簇 索引 


在 图 8-5 后 面 的 讨论 中 ， 我 们 看 到 通常 连续 插 人 到 表 中 的 行 在 磁盘 上 是 连续 存放 的 ， 使 用 
的 是 堆 结 构 ( 几乎 所 有 的 数据 库 系 统 都 采用 这 种 方法 ,ORACLE 的 缺 省 堆 组 织 就 是 一 个 例子 )。 
仁 图 书馆 中 ， 这 就 像 按照 书籍 购买 的 顺序 把 书本 放 在 书架 上 一 一 一 种 不 常 使 用 的 方法 ， 但 是 
只 要 有 许多 目 逐 卡片 允许 我 们 根据 不 同 的 分 类 法 来 查找 所 有 的 书籍 ， 这 还 是 挺 方 便 的 。 但 是 
更 通常 的 做 法 是 ,根据 杜威 十 进 制 编码 { 非 小 说 类 书籍 ) 或 作者 名 小 说 类 书籍 ) 来 安排 书 
架 上 书籍 的 存放 。( 实际 上 上， 小 说 的 存放 顺序 通常 是 根据 作者 的 姓 、 作 者 的 名 、 作 者 中 间 和 名 和 
主题 来 存放 的 ) 这 样 的 存放 方法 是 很 方便 的 。 如 果 我 们 想 要 找到 所 有 查尔斯 狄更斯 的 小 说 ， 
我 们 可 以 在 书目 目录 中 查找 任何 一 本 狄更斯 的 小 说 ， 然 后 到 于 那个 所 有 狄更斯 的 小 说 所 在 的 
书 洪 ， 所 以 很 锯 就 可 以 找到 所 有 他 与 的 小 说 了 ， 这 样 节省 了 好 多 步骤 。 类 似 地 ， 如 果 我 们 想 
要 找到 所 有 关 十 造 桥 方面 的 书籍 ， 可 以 根据 杜威 分 类 法 ( 非 小 说 类 书籍 主题 分 类 的 分 类 法 ) 
找到 所 有 桥梁 方面 书籍 所 在 的 书架 。 

根据 索引 键 值 把 书 放 在 书架 上 或 者 把 记录 行 放 在 磁盘 上 被 称 为 聚 闭 (clustering)。 所 引用 
的 行 和 键 值 顺序 一 样 的 索引 称 为 聚 答 索引 (clustered index， 有 时 在 DB2 UDB 中 称 为 
clustering index ), 

主 索 引 (primary index) 是 比 聚 簇 索引 更 一 般 的 概念 , 它 指 证 了 记录 行 在 磁盘 上 的 存放 位 置 ， 
在 B 竺 主 索引 【 主 索引 的 一 个 例子 ) 中 , 行 实 际 是 存放 在 B 树 的 叶 节 点 上 的 ， 代 圭 了 我 们 前 面 
讨论 过 的 ROWID 存 放 的 索引 项 。 包 含 指向 行 ROWID 指 针 的 索引 现在 被 称 为 辅助 索引 
(secondary index)， 以 区 别 于 主 索引 。 一 张 表 中 只 能 有 一 个 主 索引 ， 而 串 很 多 数据 库 产品 ( 例 
如 DB2 UDB) 根 本 就 不 支持 主 索 引 的 概念 ， 而 另外 一 些 数 据 库 产品 (例如 CORACLE) 提 供 的 主 索 
3 也 有 很 多 的 限制 。 值 得 注意 的 是 B 树 主 索引 肯定 是 聚 放 索引， 因为 行 的 顺序 必须 和 索引 中 键 
值 的 顺序 一 致 。 但 是 ， 另 外 一 种 类 型 的 主 素 引 使 用 散 列 存储 ， 在 散 列 主 索引 中 ， 行 以 宕 引 键 
的 散 列 值 的 顺序 存放 在 磁 扒 上 和。 因为 散 列 值 是 随机 的 ， 因 此 连续 的 键 值 之 问 没 有 相关 性。 所 
以 这 种 索引 不 是 合 徐 索引 ， 具 有 连续 键 值 的 行 在 磁盘 上 的 位 置 可 能 相 阳 很 远 。 

数据 库 中 的 豪 艇 索引 的 优点 在 于 : 当 所 需要 的 行 彼此 间 很 菲 近 的 了 时候， 这 些 查 询 可 以 竟 有 
效 地 执行 。 因 为 查询 需要 的 平均 行 具 且 一 个 页 面 中 的 很 小 一 部 分 ， 所 以 如 果 行 是 素 簇 在 一 起 
的 ,那么 我 们 只 要 读 出 含有 一 个 所 需 行 的 那 一 个 页 面 ， 其 他 所 需 的 行 就 可 能 位 于 同一 页 面 上 。 
这 样 ， 访 问 其 他 行 的 时 候 ， 我 们 可 能 就 不 需要 进行 TO 操 作 。 即 使 我 们 访问 数据 库 的 方法 是 很 
初级 的 并 且 根 据 行 的 ROWID 值 每 次 只 访问 一 行 ， 我 们 会 发 现 第 二 行 以 及 后 续 行 已 经 在 内 存 组 
冲 区 中 的 一 个 页 面 上 。 内 存 缓冲 区 【和 参 抑 图 8-2 ) 是 为 了 节省 系统 处 理 TO 操 作 而 设计 的 。 为 一 
方面 ， 非 聚 复 索 引 就 设 有 这 一 优点 。 非 聚 簇 索引 的 后 续 行 可 能 处 于 磁盘 上 的 很 还 的 地 方 ， 押 
以 就 不 能 节省 处 理 IO 操 作 的 时 间 。 这 就 象 是 我 们 需要 走 饥 整个 书架 来 得 到 所 有 狄 惠 斯 的 小 说 
一 样 。 图 8-19 说 明了 聚 秘 索引 各 非 聚 簇 索引 的 比较 。 
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图 8-19 非 聚 科 索 引 C 上 } 和 这 和 馈 索引 (下 ) 的 比较 


例 8.4.1 一 个 大 的 商店 在 美国 一 共有 上 百 家 的 分 店 ， 并 有 1000 万 个 顾客 。 该 商店 创建 了 
一 张 customers 表 ,其 中 的 询 名 分 别 为 straddr, cityst, zipcode,，, age,， 
incomeclass【 和 值 从 1 到 10， 家 明 家 庭 收 入 的 等 级 ， 从 低 到 高 )，hopby(50 个 不 同 的 值 ， 从 
飞行 学 到 动物 学 )，majorldept，major2dept (顾客 消费 最 多 的 两 个 部 门 )， 还 有 一 些 其 
他 的 列 属性 。customers 表 的 主要 用 处 是 找 出 应 该 给 哪些 顾客 投递 邮件 。 通 常情 况 下 ， 这 种 
情况 发 生 在 某 一 个 特定 的 地 区 ， 甚 至 是 茶 个 特定 的 分 店 (因为 不 同 地 区 在 购买 什么 样 的 商品 
方面 有 不 同 的 要 求 ， 我 们 也 斌 有 是 够 多 的 商品 可 以 在 某 个 地 区 的 所 有 商店 蜂 出 售 )。 因 此 我 们 
需要 通过 下 面 的 Seieet 语句 给 Boston 地 区 的 喜爱 运动 的 顾 容 投递 运动 设备 标签 ;: 


select name, address, city, state, Zip from customers 
Where city = “Boston’ and age between ] and 50 and hopby in "racket Sports', 


"jogging’, hiking , "bodybuilding", ‘outdoor sports")}; 
当然 ， 这 些 字段 应 访 通 过 ~ 个 应 用 程序 格式 化 为 投 弟 标签， 而且 查 询 需 要 通过 游标 在 详 
人 式 SQL 语 句 中 执行 ， 但 是 在 这 个 即席 的 Select 语 名 中 WO 操作 的 性 能 的 考虑 是 一 样 的 。 
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现在 考虑 针对 这 个 查询 最 好 的 建立 索引 的 方法 。 首 先 ， 我 们 在 zipceae 列 上 建立 一 个 事 
簇 索引 ， 这 样 Boston 地 区 的 所 有 行 或 者 实际 上 任意 一 个 地 理 区 域 的 行 都 在 磁盘 上 的 一 乒 连 续 
空间 里 。 遂 过 统计 信息 ， 我 们 可 以 发 现 Bostoa 地 区 的 顾客 占 了 整个 美国 的 1000 万 顾客 的 1750， 
即 200 000。 如 果 我 们 使 用 的 数据 库 的 真 面 是 2KB 大 小 的 ， 每 个 顾客 行 沉 要 100 字 节 ， 那 么 每 
一 个 页 面 可 以 包 会 20 行 ， 一 共 需 要 10 000 个 页 面 。 如 果 上 面 的 查询 要 求 选择 1/5 的 Boston 的 顾 
客 ， 那 我 们 会 发 现 40 000 行 仍然 会 占用 上 述 10 000 个 页 面 中 的 大 多 数 。 介 是 ， 如 果 我 们 没有 创 
建 聚 繁 索引 ， 那 么 Boston 的 顾客 记录 可 能 会 存在 于 500 000 个 磁盘 页 面 上 { 1000 万 行 除 以 20 行 / 
页 面 )， 而 且 几 乎 每 一 个 40 000 条 记录 都 会 需要 一 次 单独 的 IO 操作 。 因 此 训 答 索引 使 得 六 要 访 
问 的 页 面 数 从 40 000 减 少 到 10 000。 如 果 每 秒 执行 80 次 UVO 操 作 ， 那 么 这 就 是 500 秒 和 125 秒 的 
差别 ( 昌 然 不 同 的 磁盘 豆 可 以 周 时 执行 多 个 磁盘 访问 动作 ， 但 是 如 果 这 些 查询 中 只 有 … 个 为 
资源 而 亮 争 ， 那 么 该 查询 消耗 的 时 间 就 接近 于 磁盘 臂 使 用 的 时 间 )。 

如 果 我 们 对 吧 HERE 子 名 再 加 - - 些 眼 制 ， 酌 如 只 寡 给 那些 在 体育 商品 部 门 进 行 大 条 交 易 的 
顾客 (majorldept =' sports ' 上 或 者 najcr2dept = 'sports') 和 和 家庭 收入 较 高 的 顾客 
{ incomeclass 为 9 或 10) 那么 我 们 只 请 要 给 2000 个 顾客 邮寄 。 最 和 甸 呈 需要 访问 2000 个 磁盘 页 
面 ， 假 设 我 们 可 以 同时 估计 出 所 有 这 些 WHERE 子 名 中 的 谓词 。 我 们 考虑 的 主要 数据 库 系 统 都 
可 以 做 到 这 一 点 ,假设 在 所 有 其 他 属性 上 都 建 有 辅助 索引 。 如 果 我 们 没有 这 样 的 辅助 索引 ,我 
们 需要 访问 10 000 个 页 面 上 的 所 有 Boston 的 顾客 ,这 样 才能 知道 哪些 行 满 足 其 他 的 谓词 限制 。 

在 例 8.4.1 中 我 们 做 了 很 多 很 设 ， 但 是 关于 这 些 假 设 我 们 要 到 下 -一 草 中 省 会 详细 讨论 。 现 
在 ， 我 们 只 是 简单 地 认为 这 些 假设 在 大 多 数 的 商业 数据 库 中 是 成 立 的 ， 而 聚 馈 索引 和 非 虞 欠 
索引 之 间 巨 大 的 性 能 差别 使 得 公 徐 索引 的 价值 更 加 上 明显。 我 们 还 需 说 明 的 是 ， 我们 并 不 需要 
有 大 量 的 重复 键 值 来 说 明 陛 馈 索 引 和 非 紊 簇 索 引 之 间 书 大 的 性 能 差异 。 使 用 BETWEEN 贡 词 
BETWEEN keyvall and keyval2 的 查询 也 可 以 从 聚 禾 索 引 中 获得 巨大 的 好 椒 ， 半 使 这 些 
键 值 是 唯一 的 。 不 幸 的 是 ， 一 次 我 们 只 能 通过 一 个 索引 京 条 一 个 表 。 很 明显， 我 们 不 能 把 非 
小 说 的 书籍 同时 按 杜 威 十 进 制 分 类 法 和 作者 名 存放 在 书架 上 ， 我 们 只 能 选择 其 中 的 一 种 方法 。 
用 于 育 篮 表 的 行 的 索引 ， 主 要 依赖 于 数据 库 上 经 常 使 用 的 查询 类 型 。DBA 通 常 和 应 用 程序 管 
理 员 和 程序 员 (他们 能 知道 最 经 常 使 用 的 查询 类 型 ) 进行 商量 来 决定 应 该 怎样 使 用 聚 禾 索引 。 

1. DB2 UDB 中 的 聚 徐 索引 

当然 ， 接 下 米 的 问题 就 是 我 们 怎么 样 创建 聚 簇 索 引 。 不 同 的 数据 库 产 品 创建 公敌 索引 的 方 
法 是 不 同 的 。 在 图 8-20 中 ， 我 们 可 以 看 到 DB2 UDB 的 Create Indexi 语 句 有 一 个 CLUSTER 子 句 。 

CREATE FUNIOUE} INDEX indexname ON tablename 
{columnname [ASC | DESC] ff, columnname [ASC | DESC])) 


LINCLUDE (cotummname [ASC | DESC] f, colummname [ASC | DESC]] 
[CLUSTER] 


EPCTFREE n] 
[MINPCTUSED mn] 
{ALLOW REVERSE SCANS]: 





图 8-20 具有 CLUSTER 于 句 的 DB2 UDB 的 Create Index 语 名 


DB2 UDB 的 CLUSTER 子 句 没有 任何 参数 ，-- 张 表 只 能 有 一 个 索引 被 标识 为 聚 艇 索引 。 当 
空 表 上 的 一 个 索引 被 标识 为 聚 艇 索引 时 ， 在 装载 新 行 (使 用 DB2 UDB 的 LOAD 命 令 ) 前 ， 用 
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情人 必须 按 CLUSTER 键 值 对 操作 系统 文件 中 的 行 排序 。 如 果 和 十 先 排序 记录 不 方便 的 活 ， 可 以 按 
任何 顺序 装载 行 并 调用 REORGANIZE 命 令 。 结 果 和 图 8-19 中 下 面 的 图 其 似 ，B 树 中 索引 的 顺 
序 和 页 面 上 行 的 顺序 是 一 致 的 。 实 际 上 ， 束 个 结构 像 一 个 扩充 了 -- 层 的 B 树 ， 核 键 值 排 序 的 行 
在 新 的 叶子 层 ， 而 原来 的 叶子 层 则 作为 高 一 层 的 上 且 录 层 。 这 是 我 们 期 望 的 B 树 主 索引 结构 。 

不 笠 的 是 ， 这 种 类 比 有 点 不 准确 ， 因 为 当 新 行 被 插 人 的 时 候 ， 这 种 结构 的 行为 和 我 们 和 希 
望 的 主 索引 是 木 -- 致 的 。DB2 UDB 建 议 表 的 创建 者 在 页 面 上 留 有 一 - 些 可 用 空间 (使 用 Create 
Table 语 侣 的 PCTFREE 子 条 )， 这 样 当 揪 和 人 新 行 的 时 候 ，DB2 UDB 就 可 以 把 行 插 到 正确 页 面 
的 可 用 得 里 ， 从 而 能 保持 聚 篮 顺序。 但 是 ， 如 果 页 珈 上 没有 可 用 框 了， 那么 B 树 就 不 会 分 发 
该 叶 节 点 页 面 ， 如 果 可 能 的 话 则 在 当前 区 域内 分 配 一 个 新 页 面 ， 若 当前 区 域 (extent) 满 了 ， 则 
在 表 的 最 后 的 男 一 个 区 域 中 分 配 一 个 新 页 面 。 我 们 搬入 的 新 行 越 长 ， 聚 徐 性 就 融 小 ， 因 为 后 
面 的 行 并 不 按 聚 艇 顺序 插 人 。 最 后 ， 索 引 可 能 会 备 失 大 多 数 的 襄 往 属性 ， 用 户 被 建议 使 用 
REORGANIZE 操 作 ， 从 而 保证 行 按 正确 的 顺序 排列 ， 并 重新 在 每 个 页 而 上 留 肥 一定 的 可 用 
室 间 . 

我 们 将 会 看 到 ，DB2 UDB 使 用 聚 徐 索 引 检 索 将 会 减少 大 量 的 11O 操 作 。 在 例 8.4.1 中 ， 
Boston 地 区 的 记录 可 能 需要 从 10 000 个 连续 页 面 中 取得 ，DB2 UDB 实 际 上 是 读 取 多 个 页 面 
( 被 称 为 预 取 LO )， 这 样 就 增加 了 每 秒 访问 磁盘 页 面 的 个 数 。 在 8.2 节 中 ， 我 们 说 过 WO 时 间 中 
主要 是 消耗 在 磁盘 辟 移 动 到 正确 的 位 置 ， 一旦 磁头 开始 读 取 数据 传输 数据 所 消耗 的 时 间 很 少 。 
如 果 我 们 在 磁盘 臂 定位 在 其 一 位 置 之 后 多 读 一 些 页 面 的 话 ， 我 们 就 会 提高 UVO 操 作 的 速度 ， 在 
某 些 情况 下 可 以 得 高 10 售 ， 在 其 他 DBMS 产 品 中 ， 这 么 高 的 名 页 面 流 写 性 能 是 不 匹配 的 。 我 
们 会 在 第 9 章 中 谈 到 这 个 问题 。 

2. ORACLE 中 特殊 的 索引 特征 

ORACLE 中 有 一 些 特殊 的 案 引 表 的 访问 结构 ， 包 括 索 引 组 织 表 、 案 引 聚 雍和 散 列 聚 谈 ， 
下 面 我 们 就 对 此 进行 介绍 。 

(ORACLE 的 索引 组 织 表 

图 8-5 中 的 ORACLE 的 Create Table 语 句 有 一 个 DRGANIZATION INDEX 子 何 : 


CREATE TABLE Lschema. J]tablename 
{fcolumnname datatype . 
LORGANIFATION HEAP | ORGANIZATION INDEX 【this has clauses Not covered)}] 


如 果 出 现 了 这 一 条 子 句 ， 被 建立 的 表 中 的 行 被 放 在 责 正 的 B 树 主 索 引 中 ， 按 B 树 的 叶子 层 
的 键 值 顺序 排 烈 。 当 插入 新 行 的 时 候 ， 它 们 会 以 正确 的 顺序 插 到 B 树 的 叶子 层 中 ， 当 叶 节 反 没 
有 可 用 空间 财 ， 该 时 节点 会 分 裂 ， 而 且 分 烈 后 的 两 个 叶 节 点 里 行 的 顺序 还 是 正确 的 。 因此 ， 
ORACLE 的 震 引 组 织 表 中 的 所 有 行 是 按键 值 聚 艇 的 ， 当 反 人 新 行 的 时 候 ， 仍 然 保 持 聚 簇 。 这 
似乎 是 一 个 理想 状态 ， 实 了 味 上 的 索引 组 织 表 上 会 有 一 些 限制 ， 这 个 限制 就 是 ORGANIZATION 
INDEX 结 构 中 的 B 树 键 值 必须 是 表 的 主键 。 

证 我 们 再 回来 看 看 鲍 8.4.1。 在 这 个 例 主 中 ， 我 们 建立 了 索引 ， 能 从 指定 的 地 区 中 控 
hallies 或 者 incomeclass 来 检索 顾客 。 在 烈 zipcode 上 创建 了 一 -个 聚 徐 索 引 ， 在 同一 地 
区 的 行 都 钼 在 连续 的 徽 盘 页 面 上 。 同 时 ， 列 上 的 其 他 辅助 索引 ， 例 如 hebby 和 
incomeclass， 主要 是 限制 从 磁盘 上 检索 出 的 行 。 

在 ORACLE 中 ， 我 们 不 能 在 列 zipcode 上 定义 索引 组 织 表 ， 因 为 zipcode 不 是 该 表 的 主 
键 ( 它 也 不 是 后 选 键 ， 因 为 同一 个 zipcode 有 包 个 行 对 应 )。 我 们 使 用 素 custs 的 主键 
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custid, 但 是 这 样 就 不 清楚 怎么 分 配 顾 客 号 以 保护 地 理 位 置 。 为 了 能 提供 按 地 理 位 置信 息 排 
序 的 唯一 主键 ， 我 们 需要 使 用 至 少 两 个 列 作为 主键 ， 例 如 zipcode 和 custid。 这 样 我 们 可 
以 在 nopby 和 incomeclass 上 上 定义 辅助 索引 。( 索引 组 织 表 在 ORACLE 8 中 已 经 可 以 使 用 ， 
但 是 直到 ORACLE 8i 发 布 时 ， 没 有 ROWID 可 以 在 这 种 结构 中 使 用 ， 因 此 不 能 定义 辅助 索引 。 
但 是 在 ORACLE 8i 中 ， 逻 辑 ROWID 这 一 新 特征 可 以 为 辅助 索引 提供 支持 . ) 

(2) ORACLE 的 表率 簇 

ORACLE 中 的 肾 珍 是 包含 了 在 某 些 特定 列 上 进行 连接 的 多 张 表 中 的 行 的 结构 ， 通 常 是 以 外 
键 和 主键 的 方式 。 这 些 进行 连接 的 列 通 常 定 多 为 聚 桂 键 ， 因 此 两 张 表 中 其 有 相同 聚 复 键 值 的 行 
在 磁盘 上 是 存放 在 一 起 的 。 例 如 ， 表 emplovees 和 表 dqepartments 都 有 一 个 列 geptno， 这 
个 列 主要 用 于 两 张 表 的 连接 运算 。aeptno 列 在 包含 两 张 表 的 阳 租 里 作为 华能 键 合用。 两 张 表 
中 具有 同一 个 键 值 的 所 有 行 在 磁盘 上 被 存 情 在 一 起 。 便 如 所 有 表 emp1loyees 中 qeptno 等 于 10 
的 行 和 所 有 表 departments 中 Geptno 等 于 10 的 行 在 磁盘 上 都 存储 在 一 起 。Create Cluster 的 硬 
法 参见 图 8-21 。 


CREATE CLUSTER [schema. ] CTU 人 SePmEme 
feoTumnname datatype {. columnname datatype ... } -十 his 1s the cluster Key 


[eluster clause 人 cluster_clause ,...1]): 
聚 悉 子 句 指定 了 下 列 诸 簇 特性 : 
【PCTFREE nl [PCTUSED n] 
TSTORAGE {EINITIAL mn CKEM]] CNEXT nt [KM]] LHINEXTENTS n] [MAXEXTENTES 门 ] 
[LPCTINCREASE 11}] 
[STZE nr CKIMI] -- defaults to Cne disk blork 
[TABLESPACE tbispatename] 
[INDEX | [SINGLE TABLE] HASHKEYS n [HASH is expr]] 
[other citiauses net covered]j: 
使 用 DROP CLUSTER 语 名 来 几 除 一 个 已 有 的 圭 簇 ， 
DROP CLUSTER [schema. elustername LINCLUDING TABLES [CASCADE CONSTRAINTS]]: 





图 8-21 ORACLE 的 Create Cluster 滞 和 旬 的 语法 


图 8-21 中 的 Create Cluster 语 句 中 的 许多 子 句 都 在 Create Table 语 名 中 出 现 过 ,但 是 它们 之 
间 还 是 有 一 些 差别 的 。 首 先 ，clustername 后 的 columname datatype 并 没有 定 闵 包含 
在 该 诊 簇 中 的 表 的 所 有 列 ， 而 只 是 烈 出 了 素 乌 键 中 的 那些 列 。 表 的 定义 是 定义 了 所 有 列 和 约 
束 ， 并 指定 哪些 列 是 和 聚 徐 键 中 的 列 匹配 的 。 图 8-22 说 明了 这 个 路 配 是 怎样 指定 的 。 和 以 前 
一 样 ， 如 果 使 用 了 AS subquery 子 句 ，Create Table 的 列 定义 就 不 需要 指定 数据 类 型 了 。 


CREATE TABLE Tsthema.Jtablename 
(icolumn definitions as Basic SQL, see Figure 7.1 or Figure 8.6} 


CLUSTER clustername Ccolumnname {, coluymnname...}) -- table columns map to cluster key 


[AS subquery]; 





图 8-22 包含 有 聚 笋 的 Create Table 语 句 


Create Ciuster 语 句 中 的 PCTFREE 和 PCTUSED 关 键 词 用 于 指定 在 聚 簇 盛 盘 块 中 插 人 新 行 的 
上 时候， 磁盘 块 满 的 程度 。 图 8-5 的 CREATE TABLE 语 句 语 法 下 面 的 讨论 中 ,我们 已经 说 明 过 了 
peTEREE、PCTUSED 和 STORAGE 的 含义 。 图 8-21 中 的 SIZE 参 数 表示 的 是 为 对 应 于 一 个 桌 簇 
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键 值 的 行 所 保留 的 字 节 数 。 我 们 称 一 个 肾 答 键 值 所 对 应 的 行 所 占 空 间 为 汞 散 槽 ， 或 者 简称 为 
醒 。《〈《 这 个 术语 是 我 们 为 了 方便 称呼 而 不 是 DRACLE 中 的 标准 ) 因此 SIZE 人 参数 指定 一 个 槛 的 
大 小 ，ORACLE 用 这 个 参数 来 确定 一 个 磁盘 块 上 能 存放 的 槽 的 最 大 个 数 : 

一 个 入 盘 块 中 覃 的 个 数 = CEIL (一 个 磁盘 块 中 可 用 字 节 数 /SIZE ) 

当 SIZE 和 参数 起 过 了 - -个 磁盘 块 中 可 用 字 节 数 的 时 候 ， 每 个 磁盘 块 上 模 的 个 数 就 为 1。 如 果 
一 个 聚 奥 键 值 所 对 应 的 行 所 占用 的 空间 超过 了 SIZE 的 估计 值 ， 就 使 用 该 磁盘 块 的 其 他 槽 中 的 
空间 ， 直 到 该 伐 盘 块 满 了 。 如 有 果 该 磁盘 块 满 了 【六 出 )， 则 分 配 一 个 新 的 磁盘 块 ( 在 堆 分 配方 
式 下 ， 是 从 所 在 的 表 空 间 中 分 配 的 )， 而 对 应 于 一 个 键 值 的 行 会 用 链表 从 一 个 页 面 指向 另外 一 
个 页 面 。 但 是 这 种 六 出 将 会 导致 低 歼 的 磋 盘 访问 ， 因 此 保证 SIZE 值 足够 大 是 非常 重要 的 。 另 
-~ 方面 ， 如 果 醒 中 的 行 的 平均 使 用 空间 小 于 SIZE 值 ， 那 么 聚 艇 中 所 有 磁盘 块 上 都 会 有 空间 浪 
费 的 情 说 出 现 。 如 果 某 个 磁盘 起 已 经 有 了 最 大 值 ， 那 么 ORACLE 将 不 会 在 该 磁盘 块 上 附 吉 一 
个 聚 复 键 值 。 

图 8-21 中 的 [INDEX ! HASHKRYS n [HASH is expr]]l 子 名 :长 明了 两 类 聚 簇 ， 索 
引 案 悉 各 散 列 聚 徐 。 缺 省 值 是 索引 育儿 。 不 论 是 哪 种 聚 徐 ，- 一 个 了 徐 键 值 的 所 有 行 在 磁 蕉 上 
都 仓储 在 一 个 梢 中 。 在 索引 京 答 中 ， 聚 徐 上 还 要 创建 一 个 附加 索引 ， 这 样 就 可 以 按 案 簇 索 引 
键 和 但 访 问 行 了 《 散 列 舍 篮 不 需要 这 样 的 附加 索引 )。 在 索引 事 徐 上 创建 附加 索引 的 语法 和 图 
8-14 中 的 创建 索引 的 语法 基本 上 是 一 斑 的 ， 只 不 过 需 村 使 用 ~-- 个 ON 子 句 来 指定 聚 簇 名 ， 而 不 
是 表 各 : 

CREATE [UNIOUE] INDEX [schema. Jindexname OH CLUSTER [schema. Jclustername 

各 我 们 在 表 上 创建 察 引 木 同 ， 索 引 识 得 上 的 索引 对 于 访问 聚 簇 表 中 的 数据 旦 六 常 重要 
的 。 虽然 在 任何 时 候 索 引 都 能 被 删除 并 重新 创建 ， 但 是 在 这 期 间 索 引 襄 扔 中 的 数据 是 不 可 
被 访问 的 。 

在 索引 率 簇 上 创建 了 索引 后 ， 聚 铸 的 表 中 可 以 插入 行 。 值 得 注意 的 是 ， 聚 徐 上 定义 的 索 
引 不 是 主 索 引 。 当 误 筷 中 定义 的 表 中 的 每 一 行 以 新 的 聚 徐 键 值 第 一 次 存储 在 爸 胡 上 的 时 候 ， 
会 在 该 聚 簇 的 一 个 磁盘 块 上 为 带 有 该 聚 篮 键 值 的 行 分 本 一 个 新 槽 。 这 些 槽 是 按 堆 组 织 的 ， 先 
来 先 服务 ， 直 到 槽 的 个 数 到 了 每 个 页 面 上 多 许 的 最 大 个 数 。 因 此 ， 如 果 第 - - 张 表 中 要 插入 宗 
乒 表 的 行 是 按 到 簇 键 排序 的 ， 那 么 磁盘 块 中 的 槽 和 所 有 包含 的 行 也 是 按 舍 得 顺 序 存放 的 。 但 
是 如 果 有 按 新 的 聚 簇 键 值 插入 的 行 ， 闭 么 新 的 槽 会 按 堆 组 织 分 配 的 原则 ， 在 表 的 最 右边 的 磁 
盘 块 上 分 配 。 

在 下 一 节 中 ， 我 们 会 讨论 散 列 隔 徐 。 在 散 列 聚 艇 中 ， 当 插入 新 的 聚 馈 键 值 所 对 应 的 第 一 
行 的 时 候 ， 一 个 散 列 函数 将 按键 值 计 算 育 徐 档 的 位 协 页 和 面 位 置 。 按 某 个 给 定 聚 簇 键 值 检索 行 
的 查询 也 将 使 用 同一 个 散 列 函数 来 查找 该 行 ， 这 样 就 能 节省 B 树 查找 的 IO 次 数 。 在 本 结束 
前 ， 我 们 举 一 些 索引 聚 秘 的 例子 。 

例 8.4.2 ”一 个 典型 的 索引 聚 簇 的 例子 是 对 一 家 公司 中 的 部 门 和 峻 员 进 行 聚 鳞 。 我 们 候 
设 一 个 公共 的 查找 任务 是 在 给 定 一 个 部 门 中 访问 其 中 所 有 职员 的 信息 -我 们 首先 创建 一 个 周 
族 deptemhb: 

create cluster deptemp 


tdeptno 1nty) 
size 2000: 
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因为 在 Create Cluster 诸 句 中 缺 省 的 是 索引 集 复 并且 我 们 疫 有 使 用 HASHKEYS 关 键 字 ， 所 
以 上 面 的 聚 艇 是 -- 个 索引 聚 秘 。 现 在 我 们 创建 聚 徐 中 的 表 : 


create table emps 


{ empno int primary key. 
让 TE 由 它 varchart10) not null., 
mgr int references emps, 
deptno int not nultl} 


cluster deptemp (depntnot: 


create table depts 


‘ deptno int primary key. 
ET varchartdy., 
2d0re5s yarcharied}y 


cluster deptemp tdeptno}: 


现在 我 们 在 柴 艇 上 为 人 案 艇 键 创建 一 个 索引 : 


create index deptempx on cluster deptemp: 


我 们 注意 到 SIZE 参 数 是 设 成 了 2000 个 字 节 ， 这 就 意味 着 每 一 个 页 面 上 只 能 分 配 一 个 案 秘 
模 。 如 果 我 们 仿 设 一 个 磁盘 块 有 2000 个 可 用 字 节 ，depts 的 每 一 行 占用 40 个 字 市 ，emps 的 每 
一 行 占用 28 个 字 季 ， 因 此 在 一 个 磁盘 块 上 ， 我 们 可 以 存放 带 有 公共 deptno 值 的 一 个 depts 
行 和 (2000 -40) /28 = 70 个 emps 行 。 如 果 我 们 假设 有 一 个 大 的 部 门 里 有 1000 个 职员 ， 因 此 
这 个 槽 会 占用 很 多 连续 的 磁盘 块 。 我 们 注意 到 每 一 个 连续 的 页 面 上 有 2000/28 =71emps 行 ， 因 
此 包含 所 有 的 行 需要 《1000 - 70) 171 = 14 个 额外 的 磁盘 块 。 虽 然 这 看 起 来 需要 访问 太 量 的 磁 
盘 页 面 , 但 是 奶 果 与 depts 和 表 做 连接 的 时 候 一 下 子 访问 所 有 emps 行 相 比 ,这 还 是 可 以 接 党 的 。 
实际 上 ， 在 这 种 情况 下 我 们 将 记录 存放 在 尽 可 能 少 的 页 面 上 上。 而且， 如 果 我 们 希望 通过 其 他 
属性 访问 emps 行 的 话 ， 例 如 empno 或 者 ename， 可 以 在 emps 表 上 为 这 些 属性 创建 一 个 辅助 
索引 。( 注意 ， 在 这 种 情况 下 ，empnc 是 主键 , 已 经 有 一 个 已 建立 的 索引 ， 所 以 只 需要 在 
ename 上 创建 一 个 索引 。) 


Create index enamex on emps tename}: 加 


8.5 散 列 主 索引 
在 图 8-21 中 的 Create Clusteri 语 句 中 ， 我 们 看 到 cluster_clause 子 勺 指定 了 窜 艇 的 特性 ; 


[PCTFREE n] [PETUSED nm] 

[STORAGE CLINITIAL n CRIM]Y ENEXT m CK|IM]] [LMINEXTENTS nm] LHAXEXTENTS n] 
LPCTINCREASE nl)] 

[SIZE m [KIM] ] -- defaults to pne disk block 

[TABLESPACE thlspacename] 

[INDEX | CSTNGLE TABLE] HASHKEYS n CHASH TS expr]]l 


如 果 在 Create Cluster 语 名 中 使 用 了 关键 词 HASHKEYS ， 该 聚 徐 就 会 成 为 一 个 散 列 聚 入 ， 
该 散 列 事 往 包含 了 至 少 HASHKEYS 个 不 同 的 槽 。 然 后 ORACLE 会 创建 一 个 初始 区 域 来 包含 大 
小 为 SIZE x HASHKEYS 个 字 节 的 散 列 事 艇 (需要 注意 的 是 ， 如 果 有 STORAGE 子 句 而 且 
INITIAL 的 值 大 于 SIZE x HASHKEYS， 那 么 会 使 用 较 大 一 点 儿 的 初始 区 域 。 使 用 初始 区 域 来 
保证 初始 的 磁盘 分 配 尽 可 能 是 连续 的 是 一 个 很 好 的 方法 ), 在 一 个 散 列 取 复 中 可 以 包含 多 张 表 ， 
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但 是 从 DRACLE 8i 开 始 ， 可 选 的 SINGLE TABLE 子 句 人 允许 只 使 用 一 张 表 ， 并 对 它 进 行 优化 。 
散 列 事 复 中 的 表 的 所 有 行 都 存放 在 某 个 磁盘 块 的 某 个 槽 中 的 散 希 聚 艇 中 。 该 槽 的 模 导 是 根据 
基于 该 行 键 值 列 的 散 列 孙 数 计算 得 出 的 。ORACLE 提 上 供 了 一 个 内 上 兴 的 散 列 隔 数 ,但 是 DBAFJ 
以 通过 使 用 HaSH is expr 于 名 来 提供 一 个 用 户 自 定义 的 散 列 明 数 ， 其 中 expr 是 计算 数字 值 
的 表达 式 。 通 常用 户 不 需要 考虑 使 用 自己 创建 的 散 列 函数 ， 除 非 在 此 之 前 已 经 经 过 了 大 蔡 的 
分 析 。 但 是 ， 为 了 完整 性 ， 我 们 提供 -一 个 使 用 用 户 白 定义 散 列 函数 的 散 列 光 簇 的 例子 ， 

例 8.,5.1 我 们 创建 了 一 个 散 列 举 衣 acctclust， 只 包含 一 张 表 accounts，, 企 表 
acccounts 中 有 50 000 行 ， 这 些 行 是 检查 银行 客户 的 账号 信息 的 记录 (而 要 注意 的 是 ， 散 别 
紊 徐 和 索引 迹 簇 一样， 可 以 包含 多 张 表 ， 用 于 进行 高 效率 的 连接 操作 但 是 这 里 我 们 只 使 用 
一 个 具有 唯一 键 值 的 单个 表 ) 


ereate Cluster acctcelust Cacctid inty 
size BO 
single table 
hashkeys 100000 hash 15 modtacctid, 100003); 


值得 注意 的 是 ， 当 HASHKEYS 指 定 为 n 的 时 候 ，ORACLE 会 创建 -一 个 散 列 聚 簇 ， 它 的 实 
际 的 槽 的 个 数 $ 等 于 大 于 n 的 最 小 素数 (ORACLE 把 实际 的 槽 的 个 数 $ 仍 称 为 HASHKEYS ) 在 
这 种 情 癌 下， 如 果 HASHKEYS 最 先 指定 的 是 100 000， 那么 实际 创建 的 槽 的 个 数 是 100 003 ; 
因此 我 们 创建 了 一 个 散 列 函数 mod(acctia,100003)}， 这 个 陌 数 将 基于 acctiad 值 计算 出 相应 
的 梭 值 。 实 际 创 建 的 槽 的 个 数 { 这 里 是 100 003 ) 可 以 通过 创建 一 个 带 有 HASHKEYS 100000 
的 测试 散 列 聚 艇 来 确定 ， 然 后 执行 如 下 查 向 : 


setect hashkeys from user_clusters 
where cluster name = ACCTCLUST': 


现在 我 们 创建 表 accounts， 假设 每 行 最 大 占用 80 个 字 节 : 


create table accounts 


t acctid integer primary key, 
balance integer riat null 
ainame varchart ly not nult, 
afname varchartl2y not null, 
ami chartl) not nult, 

如 六 品名 名 抽 varchart1l2y not null, 
straddr varchartl2). 
city yarchart1n}, 
state chart2), 
ziptnde int? 
cluster acctclustiacctid}: 
注意 ,不 可 在 散 列 聚 雍 键 值 上 建立 索引 。 加 


注意 ， 在 例 8.5.1 的 表 accounts 中 有 一 个 主键 acctida。 这 就 说 明 在 该 询 上 已 经 创建 了 一 
个 B 树 索引 以 避免 有 重复 键 值 的 出 现 。 但 是 创建 了 散 列 梨 艇 后 ， 就 可 以 不 用 通过 B 树 米 访 问 
aceounts 表 中 的 行 。 在 散 殉 聚 簇 中 包含 该 琢 ， 已 经 创建 了 该 表 的 一 个 散 列 主 索 引 。 在 表 
accounts 中 插入 一 行 时 ， 首 先 对 acct1id 键 值 使 用 散 列 函数 ， 然 后 产生 - -个 伪 随 机 号 来 决定 
异 号 。 从 这 个 槽 号 ， 系 统 可 以 计算 磁盘 块 号 ， 然 后 可 以 通过 一 次 1O 操 作 访 阿 到 那个 磁盘 块 ， 
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并 把 行 存 放 汉 该 槽 中 【在 散 列 聚 艇 中 ， 一 个 槽 中 有 驳 个 行 ) 在 这 种 访问 方式 下 ， 磁 盘 块 上 面 
设 有 键 值 昌 录 ， 们 是 在 辅助 B 树 索引 中 就 有 。 这 里 说 的 散 列 事 和 能 ， 并 不 需要 在 B 树 中 进行 多 次 
MO 操 作 来 查找 指定 acctia 的 行 对 庶 的 ROWJIZD 值 ， 然 后 再 执行 一 次 IO 操作 来 访问 该 行 所 在 
的 磁盘 块 。 在 大 型 应 用 程序 中 ， 这 种 不 需要 目录 查找 直接 到 达 正 确 页 面 的 方式 是 很 有 价值 的 ， 
例如 在 每 秒 钟 需要 进行 几 志 次 账号 访问 的 大 型 银行 中 的 出 纳 程 序 。 

虽然 敬 列 的 方法 可 以 很 有 效 地 访问 具有 单个 键 值 的 行 (银行 出 结 员 通过 acctid 来 访问 客 
户 的 账户 )， 但 是 在 这 种 缮 构 中 无 法 按键 值 对 行进 行 排序 以 提供 给 定 范围 内 的 有 效 检 索 。 两 个 
连续 键 值 所 对 应 的 两 行 ， 可 能 存放 在 上 毫 不 相关 的 两 个 页 面 中 ， 这 依赖 于 盆 随 机 散 列 活 数 。 因 
此 我 们 称 散 列 访问 结构 形成 了 一 个 主 索引 ( 行 在 磁盘 上 的 位 置 是 由 键 值 决定 的 ， 并 提供 了 根 
据 指 定 键 值 的 有 效 检索 )， 而 不 是 聚 秘 索 引 ( 聚 秘 索 引 中 行 是 按键 值 的 顺序 存放 耕 磁盘 上 的 )。 
结果 ， 具 有 范围 检索 的 SQL 语句 


select acctid, afname. aWmi, alname From accounts 


whaere acctid between :low and :high: 


弓 者 
select acctid, afname, ami, alname from accounts 


where arctid >= :riow and acctid < 一 :high; 
可 能 需要 对 表 中 的 所 有 行进 行 扫描 (在 例 8.5.1 中 ，acctid 上 的 唯 - -索引 可 以 用 于 决定 范围 内 
的 行 )。 

1. 在 散 列 聚 著 中 调整 HASHKEYS 和 SI1ZE 的 和 值 

让 我 们 问 左 --- 下 ORACLE 是 怎样 决定 散 列 聚 钻 中 槽 和 数据 页 面 的 个 数 的 。 当 执行 例 8.5.] 
中 的 Create Cluster 庄 名 的 时 候 ， 会 在 一 系列 的 页 面 十 指定 $S 个 槽 ， 用 十 存放 表 中 的 行 。 
ORACLE 会 设置 3 为 第 一 个 大 于 等 于 HASHKEYS 值 的 煤 数 ， 我 们 设 PRIMECEIL 
(HASHKEYS ) 图 数 的 功能 就 是 得 到 第 一 个 大 于 等 于 HASHKEYS 值 的 素数 (在 实际 的 
ORACLE 和 其 他 数据 岸 产品 中 并 没有 PRIMECEIL 函 数 )。 

S= 槽 的 总 数 =PRIMECEIL(HASHKEYS) 

从 图 8-22 后 的 讨论 中 ， 我 们 可 以 计算 每 一 个 磁盘 块 中 的 槽 的 个 数 B: 

B = 每 一 个 磁盘 块 中 的 槽 的 个 数 

= MAX(FLOOR( 每 一 个 磁盘 块 上 可 用 字 节 数 /SIZE),1) 

不 同 的 设备 间 ， 每 一 个 磁盘 块 上 可 用 字 节 数 是 不 同 的 ， 其 中 寿 Sun Solaris 2.6 上 是 1962 个 
字 节 。 在 下 面 的 例子 和 习题 中 ， 我 们 假设 该 值 是 2000 个 字 节 。 给 出 了 B 和 S 的 值 ， 我们 就 可 以 
计算 最 初 分 配给 散 列 聚 得 的 磁盘 块 的 点 数 D。 

D=CEIL(S/B) 

因此 最 初 分 配 的 磁盘 块 总 数 D 等 于 槽 的 总 数 S 除 以 每 个 磁盘 块 的 槽 的 个 数 B， 并 且 是 上 会 
入 的 散 列 隔 艇 上 分 配 的 槽 的 总 数 S 是 不 会 改变 的 , 但 是 磁盘 块 的 总 数 是 会 改变 的 。D 是 初始 分 
配 的 磁盘 块 的 个 数 ， 如 果 杆 入 了 足 台 多 的 行 而 产生 溢出 后 ， 磁 盘 块 的 个 数 就 可 能 会 超过 DD 为 
了 避免 在 磁盘 上 出 现 碎片 ， 我 们 建议 DBA 先 计算 户 的 值 ， 然 后 使 用 Create Cluster 语 句 中 的 
STORAGE 子 馈 来 创建 一 个 至 少 包 含 D 个 页 面 的 初始 区 域 ( 如 果 空 间 有 可 能 发 生 溢出 的 话 ， 需 
要 1.1 x 户 ,， 上 成 者 更 多 )。 现 在 我 们 需要 讨论 的 是 散 列 游 出 是 怎样 发 竺 的 ， 

散 列 紊 筷 中 的 每 : - 行 都 存放 在 - -个 由 散 列 函 数 h 决 定 的 槽 中 。 键 值 对 点 的 槽 有 一 个 本 号 sn， 
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0 志 sn 所 SS - 1。 有 具体 一 点 ， 系 统 通 过 以 下 形式 来 决定 给 定 的 键 值 的 槽 导 snl: 

shi = hikeyvall) 

每 个 初始 分 配 的 赃 盘 块 都 包 售 国定 数目 的 每 个 磁盘 块 中 的 槽 的 个 数 B， 所 以 DRACLE 可 以 
通过 下 列 公式 计算 出 槽 sn1 对 应 的 磁盘 块 号 5 和 页 面 中 的 档 号 s: 


b= snirad 
5s = MODisnl, BY 


这 就 是 我 们 计算 包 售 行 的 块 导 b 的 方法 。 给 定 b， 访 问 散 列 聚 簇 中 的 一 行 只 需 竖 一 次 IO 操 
作 ， 初 始 磁盘 块 发 生 了 洲 出 时 除外 。 

鲍 8.5.2 在 例 8.5.1 中 ,我们 假设 每 一 页 面 上 有 2000 个 字 节 ， 我 们 可 以 得 到 B =FLOOR 
(2000180)=25 个 槽 / 块 ，D = CEIL ( 100003/25 ) =4001 个 块 。 我 们 可 以 使 用 STORAGE INITIAL 在 
磁盘 上 指定 8002K 或 者 更 多 的 空间 来 确保 初始 的 散 列 诊 第 在 磁盘 上 .是 连续 的 。 该 散 列 聚 艇 可 能 从 
第 31244 块 开始 ， 使 用 了 第 31245、31246 等 块 ， 而 在 散 列 罕 馈 中 的 块 续 是 b= 0.1,2.…。 对 于 时 一 
个 acectia， 例 如 acctid = 2345678， 我 们 有 hf(234S678)=MOD(234S678,100003)= 45609。 因 此 
账号 2345678 将 散 列 到 槽 45609。 这 个 模 对 应 的 相对 块 号 p= 45609/25=1824， 在 初始 散 列 率 艇 的 
4001 块 当中， 而 实际 块 导 则 是 31244 +1824 = 33068。 这 一 行将 会 存放 在 该 块 中 的 第 
s=MOD(45609.25)=9 个 槽 中 ， 在 这 个 块 的 20 个 块 当中 。 加 


散 列 沽 数 的 思想 是 把 每 一 个 不 同 的 键 值 散 询 到 不 同 的 模 叶 ,但 是 因为 只 有 8S 个 不 周 的 槽 号 
sn ， 所 以 如 时 实际 不 同 的 键 值 数 超过 了 S$， 那么 上 面 这 个 虎 求 是 做 不 到 的 。 实 际 上 ， 即 使 不 是 
这 个 原因 ， 也 有 可 能 出 现 两 个 不 同 的 键 值 散 列 到 同一 个 槽 号 。 假 设 我 们 在 一 个 班 上 询问 学 生 
的 生日 (一 个 从 1 到 365 的 伪 随 机 数 )。 我 们 假设 使 用 散 列 函数 把 学 生 散 列 到 365 个 措 中 ， 当 学 
生 的 数据 达到 某 个 特定 值 ( 低 于 365， 或 者 只 有 365/2 )， 就 有 可 能 出 现 两 个 学 生 有 相同 的 生日 
的 情况 。 这 种 现象 被 称 为 “生日 问题 "， 我 们 会 在 习题 中 看 到 更 多 这 样 的 例子 。 当 两 个 不 问 的 
键 值 散 列 到 同 -个 槽 时 ， 我 们 称 为 散 列 冲突 。 

在 图 8-23 中 ， 我 们 可 以 在 到 一 个 散 列 聚 簇 表 有 ?7 个 行 稀 巩 分布 在 8 个 数据 页 的 48 个 槽 中， 
而 每 一 个 页 面 上 有 6 个 槽 ， 一 个 页 面 在 图 8-23 中 表示 为 有 6 个 醒 的 一 和 7。( 实际 上 ，ORACLE 中 
的 情 的 个 数 必 须 是 素数 ， 但 是 这 里 我 们 忽略 这 一 点 。 } 散 列 函 数 h( ) 败 于 对 键 值 进行 散 列 操作 。 
在 图 8-23 中 我 们 只 显示 了 存 情 在 页 面 上 行 的 键 值 。 在 图 8-23 中 ， 我 们 可 以 看 到 键 值 55 和 39 散 
列 到 同一 个 本 中 ， 从 而 引起 了 散 列 冲突 。 


hi55)= 档 33 





图 8-23 散 列 聚 包 中 的 冲突 ， 发 生 在 插入 键 值 558J 
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如 果 插 人 一 个 新 的 键 值 所 对 应 的 行 的 时 候 ， 发 现 它 所 散 列 到 的 槽 已 经 被 另外 一 个 键 值 所 
使 用 ， 那么 DRACLE 会 扩 记 该 权 的 空间 以 插 人 新 行 。 值 得 注意 的 是 ， 散 列 聚 艇 和 索引 聚 和 能 一 
样 ， 可 能 会 有 分 配给 它 的 多 张 表 。- … 个 疾 唯 一 的 聚 秘 键 值 和 一 张 表 河 应 。 因 此 ， 即 合 没 有 散 
列 冲 罕 ， 同 一 个 槽 中 也 可 能 存 有 多 个 行 。 散 痪 到 同一 个 槽 的 行 在 磁盘 上 下 能 是 不 有 连续 的 ， 它 
们 是 通过 链接 的 方式 连 在 一 起 的 。ORACLE 将 试 着 为 某 一 新 搬入 的 行 扩 展 某 个 糟 以 保证 所 有 
的 行 都 在 同一 个 页 面 上 ,这样 就 可 以 最 小 化 在 链表 中 查找 所 需 的 IO 操作 的 次 数 。 只 有 当 第 一 
个 磁盘 块 中 的 空间 已 经 用 完 的 时 候 ， 才 会 在 下 一 个 页 面 上 分 配 空 间 (新 的 页 面 会 按 堆 组 织 表 
的 方式 来 分 配 )。 当 洲 出 页 面 的 个 数 椒 断 增 加 的 时 候 ， 插 入 行 所 需 的 时 辣 也 会 越 来 越 长 ， 因 为 
必须 搜索 整个 链表 ， 浏 览 多 个 磁盘 块 。 

为 了 在 散 列 聚 徐 中 获得 较 高 的 性 能 ， 有 必要 提供 较 大 的 HASHKEYS 利 SIZE 参 数值 ， 这 样 
出 现实 面 之 间 溢 出 的 情况 就 会 相当 少 了 。 当 然 ， 划 果 我 们 像 例 8.4.2 一 样 把 表 depts 和 emps 收 
察 谷 ， 其 中 deptno 是 取 族 键 ， 每 一 个 deptno 和 值 对 应 了 几 百 个 emps 表 的 行 ， 那么 对 上 应 的 每 
个 槽 不 可 避免 地 会 出 现 一 个 长 的 溢出 链表 占用 多 个 磁 奴 块 的 情况 。 但 是 ， 这 涉 是 散 询 聚 艇 创 
建 的 吕 的 。 当 散 列 聚 徐 发 生 洲 出 的 可 能 性 很 小 的 时 息 ， 查 询 计划 将 使 几 散 列 来 访问 窜 敌 中 的 
行 ; 但 是 ， 如 果 洲 出 经 党 发生， 那么 查询 优化 器 将 放弃 司 用 散 列 访问 ， 而 使 用 辅 有 愚 的 B 树 索引 
访 间 。 

考 虚 一 下 例 8.5.1 中 的 情况 ，50 000 个 行 放 在 聚 艇 acctclust 中 的 100 003 个 情 中 。 和 三 这 种 
情况 下 ， 磁 奶 块 平均 县 灶 满 的 ， 所 以 溢出 是 很 少 发 生 的 (我 们 将 在 下 一 节 中 讨论 洲 出 出 现 的 
次 数 }。 但 是 ， 如 果 我 们 把 500 000 个 行 放 在 100 003 个 槽 中， 那么 就 会 有 很 多 溢出 出 现 。 平 均 5 
行 会 散 列 到 同一 个 槽 中 ， 这 些 磁 盘 块 会 被 最 先 的 100 000 条 记录 填 满 ( 假设 SIZE 参 数 的 值 足 够 
大 ， 能 装 得 下 一 个 accounts 行 )]， 从 那 以 后 就 会 发 生 谥 出 。 由 于 有 大 量 的 淮 出 页 面 ， 散 列 就 
不 再 是 访问 行 的 有 熬 方式。 查询 优化 器 将 改 为 使 用 在 accid 上 的 辅助 《 唯 -~ ) 索引 来 访问 行 ， 
国 为 acctiaq 是 表 的 主键 ， 所 以 该 辅助 索引 是 存在 的 。 

调整 散 列 豪 秘 一 个 通常 的 规则 是 ，Create Cluster 语 名 中 的 HASHKEYS 参 数 设 为 使 用 的 聚 
雍 键 最 大 可 能 个 数 的 两 倍 ，SIZE 参 数 应 该 比 磁盘 欣 小 ， 以 提供 更 有 将 的 访问 《虽然 散 列 聚 艇 
可 以 支持 较 大 的 SIZE 值 ， 但 是 此 时 效率 较 低 )， 查 是 SIZE 的 值 应 该 能 足够 容纳 一 个 豆包 键 值 
所 对 应 的 所 有 的 记录 。 因 此 ， 例 8.4.2 中 emps-dqepts 聚 能 是 不 应 该 使 用 的 ， 除 非 我 们 知道 每 
个 部 门 职员 个 数 的 上 限 保 证 了 将 填 满 一- 个 磁盘 块 。 一 个 散 列 柴 簇 中 只 有 一 个 具有 单一 聚 徐 键 
值 的 表 是 非常 普通 的 。 

2, 所 用 楼 的 个 数 不 会 增加 

前 面 我 们 说 过 ， 一 旦 散 列 表 中 的 覃 的 个 数 $ 指 定 以 后 ，S 的 值 就 不 能 再 增加 了 。 这 个 限制 
的 原因 是 ， 散 列 函数 可 以 被 认为 有 两 个 步骤 组 成 ， 在 第 一 步 里 ， 先 产生 一 个 和 键 值 有 关 的 伪 
随 宙 数 x = r(keyvaluej，z 是 (0,1) 之 间 均 多 分 布 的 浮 点 数 。 第 二 下 ， 槽 号 keyvalue) 是 散 列 函数 
根据 了 下列 公式 计算 出 来 的 : 


hfkeyvalue} = INTEGER PART_OFS x rtkeyvalue)) 

该 公式 的 结果 是 0,1,…,5 - 1 之 中 的 随机 槽 号。 大 多 数 的 散 列 消 数 都 采用 这 两 个 步 绝 ， 内 
为 在 这 种 方法 里 对 于 任意 给 定 的 S 值 ， 通 用 函数 fr 都 可 以 得 到 0 和 5 - 1 之 则 整数 的 均匀 分 布 。 但 
是 ， 如 果 模 的 总 数 发 生 了 变化 ， 例 如 变 为 8'， 我 们 可 坟 发 觉 散 列 范 数 


hrikeyvalue) ~ INTEGER_PART_OFIS' x rikeyvalue)) 
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将 不 会 得 到 与 前 面 计算 出 来 的 所 有 覃 位 置 相 同 的 槽 号 。 例 如 ， 如 果 r(keyvaluey=0.33334， 
而 且 S=2， 那么 
hikeyvalue]} = INTEGER_PART_OF2 x 0,33334)=0 
但 是 如 果 s = 3， 那 么 
hikeyvalue} = INTEGER PART _ OFS x 1.333341 = 工 
这 就 是 为 什么 在 散 列 组 织 表 中 不 能 增加 用 于 存储 数据 的 页 面 的 个 数 的 原因 。 
因为 这 些 方面 的 考虑 ， 如 果 散 刻 键 值 的 个 数 超过 了 初始 定义 的 HASHKEYS 值 而 导致 页 面 
经 常 洲 出 的 时 修 ， 用 户 需 要 创建 一 个 有 较 大 HASHKEYS 值 的 新 散 列 谊 欠 ， 然 后 把 行 从 原来 的 
聚 能 移动 到 这 个 新 的 聚 秘 里 。 一 个 简单 的 方法 是 ， 创 建 一 个 有 所 需 HASHKEYS 值 的 新 散 列 聚 
簇 ， 然 后 使 用 CREATE TABLE...AS 把 原来 聚 猎 角 中 的 行 移动 到 新 的 人 党 簇 中 。 
3. 散 列 主 索 引 的 优 缺点 
为 了 让 一 张 表 或 者 多 张 表 能 够 存储 在 散 列 府 艇 所 ， 用 户 必须 要 了解 -- 些 特性 ; 
* 在 大 多 数 查 询 中 ， 能 使 用 某 一 个 查找 键 。 使 用 该 查找 键 的 某 个 键 值 能 检索 出 唯一 一 行 或 
者 较 小 的 行 集合 { 这 意味 着 不 经 常 使 用 范围 检索 )。 

"给 定 一 个 唯一 键 值 而 检索 出 的 较 小 的 行 集 合 ， 能 简单 地 存放 在 -- 个 廊 堆 页面 1。 

“ 聚 艇 击 要 使 用 的 HASHKEYS 能 很 容易 地 事先 计算 出 来 。 而 上 且 一 H 老 装 载 后 .在 乍 时 间 
内 不 会 有 较 大 的 变化 。 

大 量 的 数据 库 方面 的 文章 分 析 表 明 ， 在 谓词 的 精确 匹配 时 散 列 主 索 引 比 B 树 索引 好 ， 它 能 
减少 得 测 的 MO 操作 次 数 。 这 一 点 我 们 已 经 讨论 过 了 ， 因 为 通过 B 树 结构 需要 通过 . … 些 高 层 的 
眼 录 节点 才 可 以 检索 出 需要 的 行 。 对 于 那些 需要 进行 有 效 地 根据 键 值 查询 的 天 表 而 言 ， 通 党 
需要 三 层 自 录 节 点 。 有 时 候 需 要 四 层 B 树 的 日 录 节 点 。 然 而 我 们 应 该 注意 ， 这 些 访问 中 的 大举 
数 和 LO 操作 是 设 有 关系 的 一 一 内 存 缓冲 区 能 保证 这 些 目录 节点 中 的 一 部 分 是 驻 留 在 内 存 中 的 ， 
对 于 随机 行 访问 而 言 ， 通 常 只 需要 一 次 真正 的 访问 日 录 节 点 的 IO 操作 。 但 是 ， 和 B 树 需要 两 
次 YO 操 作 和 才能 访问 行 相 比 , 散 列 索引 只 需要 一 次 访问 行 的 VO 操作 的 优点 还 是 很 重要 的 , 但 是 ， 
某 些 情况 下 的 另外 一 些 因素 能 使 B 树 比 用 户 想象 的 下 有 效 。 考 虑 下 面 两 张 表 : 


utotdeposit eMmp ] OyYees 


ea 


第 一 张 表 autodeposit 是 一 个 包含 职员 标识 eia 的 单列 表 , 是 为 那些 希望 每 周 自 动 存款 的 
顾客 创建 的 。 第 二 张 表 emp loyees 有 下 列 几 列 ，eid、 银行 号 、 账 导 和 每 个 职员 每 周 的 薪水 。 

我 们 现在 说 明 在 一 个 从 这 两 张 表 中 读 取 行 的 应 用 徒 序 中 ， 使 用 B 树 能 比 使 用 散 列 染 入 更 有 
效 。 一 个 典型 的 每 周 执行 一 次 的 程序 ， 将 从 autodeposit 表 中 一 条 一 条 地 读 取 记录 行 ， 然 后 
根据 读 出 的 eia 的 值 访问 employees 表 中 行 ， 并 在 正确 的 账号 中 自动 存款 。 对 于 B 树 索引 而 
埋 ， 是 在 eia 列 建立 B 树 索引 来 访问 smplovees 表 的 行 。 我 们 可 能 会 想到 在 表 emp1loyees 的 
eio 列 上 创建 一 个 主 散 列 索 引 ， 因 为 这 样 可 以 给 我 们 访问 这 些 行 的 更 有 玖 的 TO 操作 。 但 是 ， 
事实 证 明 这 个 想法 是 错误 的 。 

另外 一 个 可 选 的 方法 是 ， 先 根据 eidq 按 顺序 把 表 emp1Lovyees 装 载 到 一 个 党 引 组 织 的 表 中 ， 
这 样 就 可 以 提供 一 个 孙 复 组织 【另外 一 个 方法 是 先 按 eia 的 值 排序 ， 然 后 把 行 装载 到 一 个 普通 
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其 他 列 创建 辅助 索引 。 但 旺 新 插入 表 中 的 行 并 不 是 按 eia 排 序 的 。 我 们 太 知 要 进行 重组 织 才能 
保持 聚 簇 的 效率 )。 现 在 在 每 周 运 行 这 个 程序 的 时 候 ， 我 们 发 现 autodeposit 表 中 的 行 的 顺序 
和 employees 表 中 行 的 顺序 是 一 致 的 .我 们 可 以 发 现 当 对 autodaeposit 表 中 的 行进 行 御 环 的 
时 想 ， 应 用 程序 是 按 eiqd 的 值 对 employees 表 中 的 行进 行 访问 的 。 通 常 ， 对 employees 表 中 
的 后 急行 进行 访问 ， 是 通过 一 些 已 经 在 缓冲 区 中 的 月 录 节 点 向 下 访问 ， 最 后 访 间 一 个 也 已 经 窜 
缀 种 区 中 的 行 。 

HO 操作 中 访问 的 表 employees 中 的 页 面 总 数 和 当中 页 面 的 总 个 数 是 相等 的 (我 们 假 商 
大 部 分 职员 需要 自动 存款 ， 因 此 摧 要 涉 太 到 大 多 数 的 employees 表 的 数 撕 员 面 )。 为 - 方面. 
对 于 散 列 事 艇 而 二 ， 每 一 个 新 访问 的 行 都 可 能 存放 在 一 个 和 前 - -页 面 训 不 相关 的 页 面 中 ， 即 
使 它 止 被 后 续 的 键 所 访问 。 如 果 每 一 个 散 询 页 向 中 平 拘 有 10 个 职员 和 希望 直接 相 球 ， 散 列 主 索 
引 需要 的 FO 操 作 的 次 数 将 是 B 树 聚 艇 索引 的 20 倍 。 这 里 我 们 假设 散 列 磁盘 扇 过 多 而 不 能 都 驻 
角 在 缓冲 区 中 ， 而 且 和 和 数据 页 面相 比 ，B 树 页 面 很 少 。 这 两 个 假设 都 是 很 普通 的 。 

因此 我 们 看 到 了 一 个 散 列 结构 对 行 的 访问 并 不 像 其 他 有 序 结构 那么 有 效 的 例 于 。 当 然 ， 
我 们 可 以 把 行 堆 起 来 ， 因 为 ei da 引用 实际 上 并 不 是 随机 的 。 另 外 一 方面， 这 是 个 很 普通 的 情 
况 ， 读 者 应 该 意识 到 适当 安排 表 中 行 的 顺序 能 节省 访问 表 所 需 的 大 量 瘤 源 。 


8.6 向 靶 上 的 空位 随机 投 丘 飞 镖 问题 


现在 我 们 来 解决 一 个 在 数据 库 评 佑 方面 经 常 遇 到 的 概率 方面 的 问题 。 这 个 问题 是 : 有 M 
个 随机 的 空位 ， 现 在 向 上 面 投手 N 个 飞镖 。 候 设 我 们 有 N 个 飞 狂 ， 我 们 向 远 处 的 一 个 妓 投 掷 飞 
镖 ， 因 此 虽然 我 们 想 击 中 某 个 空位 ， 但 是 靶 上 的 每 个 空位 被 投 中 的 概率 是 相等 的 。 我 们 可 以 
对 这 个 问题 加 一 些 限 制 ， 然 后 提 一 些 关 于 靶 上 的 飞镖 最 终 分 配 的 问题 。 例 如 ， 我 们 可 以 问 : 
先 上 有 老少 空位 里 有 飞镖 ? 

因为 某 些 空位 里 多 个 飞镖 ， 这 个 问题 的 管 案 就 不 是 简单 的 N。 它 完全 依赖 于 空位 的 容 编 能 
力 限制 。 

1, 不 限制 空位 的 容纳 能 力 ;: 有 多 宁 个 空位 黑 有 飞鱼 ? 

证 我 们 首先 解决 最 标准 的 问题 : 有 M 个 空位 和 N 个 飞镖 ， 而 且 每 个 空位 申 飞 镖 的 个 数 没有 
限制 。 投 元 完 N 个 飞镖 后 ， 有 才 少 空位 里 有 飞镖 ?” 我 们 用 $ 表 示 某 次 投掷 完毕 后 ， 被 击 中 的 空 
位 的 个 数 ， 而 用 E(S) 表 示 对 于 给 定 N 和 M 被 击 中 的 空位 个 数 的 数学 期 望 值 。 

描述 这 个 问题 的 最 好 的 方法 是 把 它 分 成 下 列 三 种 情况 : 

。 第 一 种 情况 : 飞镖 的 个 数 远 远 小 于 空位 的 个 数 ， 即 N<<M。 

。 第 二 种 情况 ， 飞 铬 的 个 数 和 空位 的 个 数 相 近 ， 即 N 二 M。 

。 第 三 种 情况 : 飞镖 的 个 数 大 于 空位 的 个 数 ， 即 N>M。 

在 第 一 种 情况 下 , 飞镖 的 个 数 远 远 小 于 空位 的 个 数 ， 所 以 出 现 有 很 多 空位 中 有 上 是 个 或 多 
个 飞镖 情况 的 概率 是 很 小 的 。 因 此 有 飞镖 的 空位 个 数 接近 于 “& 杀 的 个 数 ， 即 S=N。( 大 多 数 
情况 下 ，S 略 小 于 N， 因 为 有 些 空位 里 有 多 个 飞镖 。) 

在 第 三 种 情况 下 ， 飞 镖 的 个 数 近 远大 于 空位 的 个 数 ， 比 如 飞镖 的 个 数 是 空位 个 数 的 二 谷 : 
这 样 太 多 数 的 空位 里 都 有 飞镖 (每 个 字 位 里 含有 飞镖 的 平均 个 数 是 三 )。 但 是 如 采 有 很 多 空位 
的 话 ， 仍 然 有 一 些 空位 里 没有 飞 针 。 因 此 这 种 情况 下 M - S<<M， 但 是 M -3S 关 0。 

现在 我 们 考虑 一 下 第 二 种 情况 : 假设 飞镖 的 个 数 和 空位 的 个 数 很 接近 ( 为 了 准确 起 见 ， 
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我 们 假设 N=M )， 有 一 些 空位 时 有 两 个 故 镖 ， 还 有 一 些 空位 里 有 三 个 或 者 多 个 飞镖 。 这 就 意味 
着 有 相当 个 数 的 空位 里 没有 飞 镶 。( M -S$S 占 了 M 的 一 部 分 , ) 但 是 直觉 告诉 我 们 试图 个 计 漫 有 
飞镖 的 空位 个 数 是 很 困难 的 。 等 一 会 我 们 可 以 看 到 当 N=M 的 时 候 ，E(S) = M({1 -e '),，e 是 自 
然 对 笋 的 底 2.1828...。 

为 了 计算 给 定 N 和 M 的 E(S)， 我 们 首先 考虑 一 下 投 掀 某 个 飞镖 d 时 ， 某 个 特定 空位 s 没 有 被 
击 中 的 概率 P。 困 为 有 M 个 空位 ， 而 飞 休 击 中 每 个 空位 的 概率 是 一 样 的 ， 所 以 某 个 飞镖 击 中 空 
位 s 的 概率 是 11M， 而 空位 s 没 有 被 击 中 的 概率 是 : 

Pr 空位 s 设 有 被 飞镖 d 击 中 ) = (1 - LAM 

如 果 空 位 数 M 的 值 较 大 ， 那 么 这 个 概率 值 是 相当 大 的 。 但 是 现在 我 们 计算 一 下 投掷 N 个 飞 
镖 后 ， 革 个 空位 没有 害 飞 镖 击 中 的 概率 是 和 多大。 投掷 每 个 飞镖 都 是 一 个 独立 事件 ， 所 以 某 个 
空位 s 没 有 被 改 销 击 中 的 概率 是 下 列 事件 的 与 s 没 有 被 第 一 个 飞 杀 击 中 且 s 也 没有 被 第 二 个 飞镖 
击 中 ，...， 且 s 也 没有 被 第 N 个 飞镖 击 中 。 

独立 事件 与 的 概率 是 各 个 事件 概率 的 乘积 ， 所 以 有 

PT 空 位 s 没 有 被 N 个 飞镖 击 中 ) = (1 -1/M) 

因为 有 M 个 空位 ， 每 个 飞镖 都 有 相同 的 概率 ， 所 以 没有 被 飞镖 击 中 的 空位 的 数学 期 望 等 
十 空位 的 个 数 乘 以 某 个 空位 没有 被 击 中 的 概率 ; 

[8.6.1] E( 没 有 被 飞镖 击 中 的 空位 的 个 数 ) = MU - LM) 

因此 ， 被 飞镖 击 中 的 空位 的 个 数 E(S)， 等 于 M 减 去 上 面 计算 出 的 值 : 

[8.6.2] ES) = ME - (1 — LAMY") 

在 微 积分 中 ， 我 们 知道 由 e 表 示 的 数 定义 为 如 下 的 极限 形式 : 


e=Lim (] +x)l 


如 果 我 们 假设 M 很 太 ， 我 们 可 以 用 - 1AM 来 代 赫 x， 然后 得 到 e 的 近似 值 : 

es 人 -TMPM 

或 者 

[8.6.3] e = (1-1AMD ™ 

从 [8.6.2] 中 ， 我 们 看 到 : 

ES =MtE-t-UVMNN = M (1 - {1 — MIM ) 

代入 公式 [8.6.3] 我 们 得 : 

[8B.6.4] FES}=M (1 -eM) 

因此 ， 被 飞镖 击 中 的 空位 的 期 望 值 就 近似 为 M(1 -e“)， 而 没有 被 飞镖 击 中 的 空位 的 期 
望 值 就 近似 为 : 

[8.6.5] BE( 没 有 被 击 中 的 空位 ) 一 Me 


在 本 章 的 例子 中 ， 我们 会 提供 一 些 使 用 这 些 会 式 的 例子 。 
2. 每 一 个 室 位 只 能 占用 一 次 : 重 试 的 次 数 ( 重 散 列 链表 ) 
在 某 些 数据 库 系统 中 ， 把 行 散 列 到 槽 时 ， 不 允许 在 槽 中 存放 煞 行 。 如 案 插 信行 的 时 候 发 
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现 对 应 的 槽 中 己 经 包含 了 某 个 行 ， 那么 必须 要 找 男 外 一 个 模 来 打 人 该 行 。 系 统 采 用 的 方法 是 ， 
把 键 值 重新 散 列 到 某 个 模 中 ， 如 果 该 槽 还 是 非 空 的 ， 则 继续 散 列 直到 某 个 槽 是 空 的 。 分 配给 
某 一 特定 的 键 值 的 槽 总 是 连续 的 ， 尽 管 不 同 键 值 之 癌 会 在 某 个 槽 上 发 生 冲 突 。 如 果 发 生 冲 突 
的 时 候 ， 重 新 散 列 总 是 试图 散 列 于 同一 页 而 上 的 槽 中 ， 但 是 如 果 在 原来 的 页 面 上 没有 空 槽 时 ， 
那么 会 试图 映射 到 上 后续 页 面 中 的 梢 中 。 读 者 应 该 注意 的 是 ， 这 个 算法 只 能 创建 相对 有 限 的 行 ， 
因为 不 能 创建 多 十 模 个 数 $ 个 行 。 我 们 想 和 要 知道 的 问题 是 ， 在 找到 一 个 空 槽 朋 ， 需 要 重新 尝试 
多 少 次 ?在 上 而 的 飞 义 的 问题 中 ， 我 们 可 以 把 这 个 问题 拱 述 成 下 面 的 简写 形式 ; 

靶 上 有 M 个 空位 ， 有 N 文 飞镖 。 每 个 空位 只 能 插 一 文 飞 镖 。 重 试 直到 所 有 首 镖 都 在 靶 上 为 
止 。 

“每 个 空位 只 能 揪 一 支 必 镖 ” 的 意思 是 ， 靶 上 每 个 空位 的 空间 只 能 搬 一 支 飞镖 。 如 果 第 一 
支 飞 镖 也 想 插 到 这 个 空位 里 时 ， 它 会 弹 回 。 耐 “ 重 试 直到 所 有 飞镖 者 在 部 上 为 止 ” 的 意思 是 
每 次 飞镖 弹 回 的 时 候 ， 我 们 拿 起 它 ， 再 重新 投 接 该 飞镖 直到 它 击 中 靶 为 止 、 最 后 当 所 有 飞镖 
都 插 在 靶 上 的 时 收 ， 我 们 有 N 万 M， 短 个 飞镖 只 能 在 -- 个 空位 里 。 在 这 种 情况 下 ， 问题“ 有 多 
少 个 空位 里 有 飞 儿 ” 的 管 案 就 是 N。 但 是 我 们 的 问题 是 另外 一 个 : 

投 毛 完 第 N 支 飞镖 后 ， 重 新 尝试 次 数 的 数学 期 望 是 多 少 ? 

管 案 和 已 经 成 功 投 指 的 飞镖 数 N -1 有 关 ， 下 面 的 分 析 给 出 了 - -个 很 好 的 近似 解 。 我 们 假 
设 M 很 大 ， 那 么 当 我 们 试图 投掷 第 K 支 飞镖 的 时 候 ， 该 装 镖 打 中 已 经 投掷 了 的 N- 1 支 飞镖 的 
概率 是 P = (N -17M， 人 也 就 是 说 该 空位 没有 被 飞镖 占用 的 概率 是 (1 -P) = {1 -(N-1WM), 这 
也 是 我 们 把 最 后 - - 行 成 功 搬 人 第 一 个 找到 的 位 置 的 概率 。 我 们 称 这 个 冲突 链表 的 长 度 是 1 只 
需要 一 次 检测 ) 并 将 其 写成 : 

Pr( 溃 突 链 表 的 长 度 为 1} = (1 -P) 

男 外 一 方面 为 了 保证 冲突 链表 长 度 为 2， 散 列 的 第 一 个 位 置 必 须 是 满 的 概率 是 P )， 第 
二 个 位 置 必 须 是 空 的 【概率 是 (1 - P) )。 利 用 多 个 独立 事件 同 时 发 牛 的 概率 是 单个 事件 发 牛 概 
率 的 乘积 ， 我 们 有 : 

Pr( 冲 突 链 表 的 长 度 为 2) = (1- P)P 

现在 计算 冲突 链表 为 3 的 情况 ， 第 一 个 和 第 二 个 位 置 都 必须 是 满 的 ( 概率 是 P* P=P*), 第 
三 个 位 置 是 空 的 (概率 是 1 ~- P)。 简 单 地 扩展 这 一 过 程 可 以 得 到 后 面 的 情况 : 

Pr( 冲 突 链表 的 长 度 为 3)= (1 - P)P- 

Pr( 冲 突 链 表 的 长 度 为 4)= (1 - P)P 


Pr( 冲 突 链 表 的 长 度 为 Ki= (1 - PP” 

现在 计算 冲 罕 链 表 的 期 望 长 度 E(LL)， 即 所 有 上 面 的 概率 习 以 相应 长 度 的 和 : 

FIL} =f1 -Pi)+2E-PIP+31 一 外 P2+ 4 -PP3+... 
或 者 写成 

[8.6.8] EREILI =1t-PI+2P+3P2+4P3+...】 

如 果 冲 罕 的 最 大 数目 较 太 ， 该 和 芍 向 于 一 个 较 大 的 值 。 更 在 我 们 给 出 求 这 个 和 的 一 个 简 
单 的 公式 。 首 先 考虑 困 数 fx): 
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ffx = x 4 xt rx txt+... 

这 是 有 和 名 的 无 限 几 何 级 数 a + af + ar2 + ar3 +… 中 a = r =x 的 情况 ， 该 几何 级 数 的 和 为 
a(1-T)， 所 以 我 们 得 到 ，; 

[8.6.7] fxj=x+xi + xt+...= wl x} 
对 上 式 求 导 可 得 : 

(8.6.8] ffxlj=1+2x+3x2+4x3+r .= -Xi 
这 样 我 们 把 会 式 [8.6.6] 改 写 一 下 : 

[B.6.9] EL =t1- PY 1 +2P+ 3P + 4P3 +...)= {1 -PITP)) 
根据 公式 [8,6.8]， 我 们 把 F(P) 换 成 7 -PY 

[8.6.10] EIL) = 11 -Pf{P) = (1 -PHIAL -PP = 1 —P} 

因此 冲突 链表 长 度 的 数学 期 望 是 (1 - P) 的 倒数 。 在 前 面 的 讨论 中 ， 我 们 说 过 (1-P)= (1 
-(N -1WYM)， 因 此 我 们 有 : 

[8.8.11] EL) = IAL -IN- YM} = MAM-N+1) 

现在 我 们 考 虚 几 个 例子 。 如 果 散 列 结构 是 50 免 满 的 ((N - 1)/M =0.5 )， 那 么 P=0.5， 而 
FL)= 110.5 = 2。 如 果 表 是 90 名 满 的 ,那么 P=0.9， 而 EUL) = 10.1 = 10。 图 8-24 表 示 了 这 种 关 
系 。 当 (N - 1M 趋 近 于 1 的 时 候 ， 冲 罕 链 表 长 度 趋 于 无 穷 大 。 


充满 程度 全 一 1MM 


90 100 





疾 8-24 E(D) 与 充满 程序 (N -1YM 的 关系 


和 我 们 想象 的 一 样 ， 表 越 满 冲突 链表 也 越 长 。 令 人 惊奇 的 是 ， 当 充满 程度 接近 于 100 的 时 
候 ， 冲 罕 链 表 的 平均 长 度 增加 得 很 快 。 如 果 每 一 个 页 面 上 可 以 存放 20 行 ， 而 把 表 装 载 到 半 满 ， 
平均 长 度 为 2 的 冲突 链表 的 长 度 不 太 可 能 会 增加 到 21。 但 是 如 果 表 满 的 程度 达到 %5 久 ， 冲 突 链 
表 的 平均 长 度 则 为 20。 所 以 半数 的 冲突 链表 会 需要 第 二 个 页 面 。 这 就 说 明 避 人 免 让 表 太 满 是 多 
么 重要 。 平 均 来 说， 我 们 可 以 注 历 冲突 链表 的 一 半 长 度 来 找到 与 某 个 唯一 键 什 相关 的 行 , 因 
此 如 果 有 大 量 的 输入 项 被 散 列 到 冲突 链 的 第 21 位 或 者 更 后 面 的 时 候 ， 开 销 就 会 随 之 增 大 。 散 
列表 如 果 含 有 重复 键 值 ， 就 需要 更 长 的 冲突 链表 ， 因 为 具有 相间 键 仿 的 行 肯定 会 发 生 冲 突 。 
在 我 们 的 推导 中 ， 我 们 假设 不 同 的 散 列 项 有 独立 的 随机 位 置 ， 当 重复 键 值 存在 的 了 时候 这 一 点 
是 不 存在 的 。 
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3. 散 列 页 面 什 么 时 候 会 填 满 
在 计算 冲突 链表 将 到 新 的 一 个 页 面 的 概率 的 时 候 ， 和 多 个 行 是 否 可 以 在 一 个 页 面 中 存储 得 
并 不 是 实质 性 的 问题 。 前 面 两 小 节 中 使 用 的 散 列 算 法 在 冲突 链表 需要 使 用 新 的 贞 面 前 ， 需 
要 使 用 完 原 来 页 面 上 的 所 有 空间 。 现 在 问题 是 ， 如果 我 们 只 把 表 装 载 到 部 分 满 ， 散 列 链表 什 
么 时 候 会 需要 使 用 新 的 贡 面 ? 学 过 统计 党 的 读者 可 以 看 看 下 面 粗 略 的 讨论 ， 
假设 一 张 有 100 万 行 的 表 ， 每 个 磁盘 页 而 上 有 20 行 。 如 果 我 们 把 每 个 磁盘 页 面 都 装载 到 半 
满 ， 即 每 个 页 面 上 只 存储 10 行 ， 我 们 需要 200 万 个 散 列 覃 来 保存 一 行 (在 ORACLE 中 ， 这 意 
味 痢 HASHKBEYS 的 值 为 2 000 000，SIZE 的 值 是 一 行 的 长 度 )。 因 此 我 们 将 需要 使 用 100 000 
个 数据 页 面 。 但 是 占用 率 是 随机 的 ， 我 们 需要 正 态 分 布 函数 来 佑 计 任 意 一 个 页 面 上 行 的 个 数 。 
对 于 表 中 的 任意 一 个 页 面 ， 某 一 行 被 散 列 到 该 页 面 的 概率 是 p = 17100 000 = 0.00001、 我 们 用 
q = (1 - p)=0.99999 来 表示 覃 是 空 的 概率 (这 个 值 和 1 非常 接近 ， 以 至 在 下 面 的 计算 中 ， 这 个 
区 别 并 不 是 很 重要 )。 所 以 散 列 到 该 页 面 的 行 数 的 数学 期 望 值 En 是 N x p， 革 中 NN 是 散 判 的 行 
的 总 数 ， 
Fir = O00001 * 1 O00 000 = 10 
平均 每 一 页 只 包含 了 10 条 记录 。 这 个 机 率 分 布 的 标准 方差 6 可 由 下 式 得 到 : 
o = Npgq = v1000000 x 0.00001 x 0.99999 = 10 = 3.162 
因此 超过 ECD+G=13.162 个 行 在 一 个 页 面 上 是 1 - 区 事件 ， 它 的 概率 为 看 (1.0)=0.158; 10 
+2*3.162 = 16.324 个 行 在 一 个 页 面 上 是 2 - 事件， 概率 为 下 (2.0)=0.228，、 超 过 20 个 行 散 列 
到 该 页 面 上 的 概率 是 四 (10/3.162) =0.000831。 因 为 表 中 有 100 000 个 页 面 所 以 其 中 有 83 个 页 
面 生 出 。 
有 一 点 儿 统 计 学 知识 的 读者 在 访问 一 个 正 态 分 布 表 时 ， 可 以 运用 这 些 居 计 值 。 
推荐 读物 
如 果 读 者 想 了 解 驻 留 内 存 的 数据 结 榴 ， 例 如 散 列 表 和 2-3 树 ， 可 以 参考 Aho、Heopcroft 和 
Ullmanm 的 书 {1]。Knuth 所 写 的 书 [5] 是 这 个 领域 的 一 本 经 典 的 书籍 ， 该 节 是 《The Artf of 
Computer Programming3 系列 中 的 一 本 。 在 前 面 几 章 中 我 们 讲述 过 的 很 多 产品 的 SQL 参考 手 
上 册 ， 对 于 理解 如 何在 表 上 建立 索引 也 是 很 有 帮助 的 。 对 理解 不 同 产 品 的 索引 能 力 有 帮助 的 参 
考 手 册 ， 我 们 用 黑体 字 表 示 。 
[1] Alfred Y.Aho, John E,Hopcerott, and Jeffrey D. Ullman, Data Structures and Algorithms. 
Reading,MA: Addison- Wesley, 1987. 
[2] Don Chamberlin. A Complete Guide to DB2 Universal Database. San Franciseo: Morgan 
Kaufmann, 1998., 
[3] DB2 Universal Database Administration Guide. IBM. Available at http://www. 
ibm.com/db2. 
[4] DB2 Universail Database SOL Reference Manual. Version 6. IBM. Available at 
http:/i/www.bim.conydb2. 
[5] Donald E.Knuth.The Art of Computer Programming: Sorting and Searching. Yolume 3. 
Reading, MA: Addision-Wesley, 1997. 
[6 INFORMIX Guide to SQL.: Reference, Wersion 9.2. Menlo Park,CA:Jnformix Press,1999， 
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http:/ ww w.informix.com., 

[了 ] INFORMIX Guide to SOL Synitax. Version 9.2. Menio Park.CA:Informix Press,1999， 
httpi// ww w.informix .com. 

[8] INFORMIX Performance Guide. Yersion 9.2. Menlo Pairk,CA:Informix Press,1999. 
htip://www.informix.com. 

[9 ORACLES Server Administrator’s Guide. Redwood Shores. CA: OQracle. 
http:// ww Ww.oracle.com. 

[IOL ORACLES Server Concepts, Volumes 上 and 2. Redwood Shores,CA:Oracle, 
http://www.oracle.com. 

[il ORACLES Server SOL Reference manual. Voltimes 1 and 2. Redwood Shores, CA. 
Oracle, http://www.oracle.com. 

[12] ORACLES Server Application Developer’s Guide. Redwood Shores, CA: Oracle. 


http://www.oracle.com. 
习题 
在 本 书 最 后 的 “习题 解答 中 有 答案 的 妇 题 用 "标记 。 
如 果 没 有 特别 声明 ， 所 有 问题 中 的 磁盘 页 面 天 小 都 是 2048 字 节 。 
8.1 很 设 某 个 DBA 在 ORACLE 中 执行 如 下 Create Table 语 句 : 


create table customers teid . . . 
storage (initial 20480. next 20480, 
maxextents HB, minaxtents 3, pctincrease 0): 


(al* 当 这 个 文件 第 一 次 创建 的 时 收 ， 会 分 配 多 少 字 节 的 位 起 空间 ? 

(b)* 该 表 最 多 可 以 容纳 多 大 的 空间 ? 

(c) 如 果 pctincrease 0 改 成 pctincrease 100， 堵 反串) 的 管 案 又 是 什么 ? 
请 给 出 计算 过 程 。 

8.2 考虑 一 下 例 8.2.4 前 给 出 的 关于 INGRES 的 TID 的 定义 .TID 定义 了 4 字 季 的 无 符号 整数 ， 
值 从 0 到 22 - 1。TID 人 允许 在 每 个 大 小 为 2048 字 节 的 磁盘 页 面 上 有 512 个 槽 ， 昌 然 实际 存放 的 数 
目 可 能 会 少 一些 。 对 于 页 面 上 的 每 一 行 ， 在 行 昨 录 里 都 保持 一 个 2 字 节 的 仿 移 量 。 

{a)* 如 果实 际 上 每 -个 大 小 为 2048 字 节 的 页 面 上 有 512 条 固定 长 度 的 行 ， 行 的 最 大 
长 度 可 以 是 多 少 ?”【( 别 忘 了 记录 目录 里 的 偏 移 量 。) 

fb) 大 小 为 2048 字 节 的 的 页 面 上 可 以 存放 多 少 条 长 度 为 50 字 节 的 行 ? 

(cj)* TID 中 可 以 表示 的 磁盘 页 面 的 最 大 数 月 的 精确 值 是 多 少 ? 

(d) 在 INGRES 的 表 中 ， 可 以 存放 的 长 度 为 50 字 节 的 行 的 最 大 数目 是 多 少 ? 

(e) 另外 给 一 个 TID 的 定义 ， 它 能 增加 INGRES 表 中 能 存放 的 行 的 最 大 数目 。 每 个 表 
的 TID 的 定义 依赖 于 表 中 行 的 最 小 长 度 mw( 从 Create Table 语 名 中 计算 得 出 )， 而 
有 可 以 使 用 一 个 更 现实 的 计算 一 个 页 面 中 可 以 存放 的 行 的 最 大 数目 的 估算 方法 。 

8.3 ”考虑 例 8.3.1 中 的 二 分 查找 法 。 推 广 它 使 它 能 处 理 侍 一 长 度 为 w 的 有 序数 组 并 允许 它 
查找 。 大 于 但 叉 最 接近 x 的 值 ， 撒 式 如 下 : 


int binsearchtint x, trt My 


TE oh mm 和 一 1 
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对 于 给 定 的 x 和 和 ,返回 满足 arr[Kj.keyvYal 主 x 的 最 小 £ 值 ， 否 则 ， 如 果 x 夫 于 和 任何 一 个 键 值 则 
返回 -1。 
8.4 ”假设 有 一 张 历 员 表 emp 中 有 200 000 行 ， 每 行 的 长 度 是 100 军 节 。 用 下 列 语 句 建立 
该 表 : 
create table emp ietd integer not null, . . . ) petfree 25: 
这 里 PCTFREE n 子 句 指 的 是 每 个 页 面 上 都 必须 要 留 有 n 免 的 可 用 空间 。 
(a)* 假 届 页 面 中 可 以 使 用 2000 个 守节 ， 行 目录 中 的 篇 移 量 是 2 守节 ， 而 且 这 2 个 字 节 
已 经 包含 在 100 个 学 节 中 了 。 估 算 表 emp 中 行 所 需 的 页 面 的 个 数 。 
假设 在 ORACLE 中 使 用 下 面 的 命令 在 表 emp 的 sid 列 创建 一 个 唯一 索引 : 


create unigqgue Tndex eidx on emp teidy petfree 20; 


(b) ORACLE 中 欧 ROWID 占 用 6 个 字 节 (如果 是 非 唯一 索引 ， 则 需要 占用 7 个 字 节 )， 
另外 每 个 键 的 列 还 需要 附加 一 个 字 节 的 空间 。 人 假设 eid 列 需要 占用 4 个 字 节 。 售 
算 一 下 eidx B 树 索引 中 ， 每 个 叶子 页 面 的 索引 项 的 个 数 及 叶子 层 页 面 的 总 数 。 
注意 Create Index 中 的 PCTFREE 子 人 可。 

(c) 人 千 算 一 下 B 树 中 每 一 个 目录 层 的 节点 页 面 的 个 数 。 假 没 B 树 中 目录 节点 的 每 一 
项 (sepkeyval,np) 的 长 度 和 叶子 层 中 项 的 长 度 相 等 。 仍然 需要 注意 
PCTFREE 子 种 。 

(dj 执行 查询 语句 select * from emp where eid between 10,000 an 
20,000 时 所 需 的 LO 次 数 是 多 少 ? 假设 eiqd 的 值 是 从 1 到 200 000 的 连续 值 ， 而 
且 盆 设 表 emp 中 记录 并 不 按 eid 某 艇 。 人 假设 磁 盘 页 面 没有 被 缓存 ， 因 此 每 读 一 
次 磁盘 页 面 都 需要 一 次 JO 操作 ,假设 WO 操作 的 速度 是 80 次 / 秘 ( 忽 赂 CPU 时 间 )， 
那么 执行 该 查询 所 需 的 时 间 是 和 多少 ”? 

(e) 假设 表 emp 中 的 记录 按 eiad 聚 簇 ， 重 新 计算 (d。 搞 行 这 个 查询 所 需 的 MO 时 间 是 
多 少 ? 

( 门 *。 执 行 查 调 select count(*}) from emp where eid is between 
10,000 and 20,000 所 需 的 WO 操作 的 次 数 (提示 ， 查询 优化 器 不 会 从 豆 中 
取 行 ， 除 非 它 需要 这 么 做 ) 执行 该 查询 的 时 间 又 是 多 少 ? 

8.5 重 做 例 8.3.4， 人 很 设 节 点 是 70 多 满 的 ， 们 是 对 于 IBM 机 页 面 的 大 小 是 4096 字 竹 。， 而 且 
假设 图 8-17 的 DB2 UDB 索 引 庄 织 RID 的 长 度 是 4 字 节 。 在 索引 中 假设 有 100 万 个 索引 项 ， 索 引 
键 是 city ,. 它 的 数据 类 型 是 char(16)。 最 终 -~ 共 有 200 个 城市 分 布 在 该 表 的 行 。 假 设 在 B 树 的 日 
录 层 没有 使 用 压 纵 。 

8.6 {a} 下列 语句 是 否 正确 ， 请 验证 你 的 管 案 : 

(i)* DB2 UDB 人 允许 一 行 跨越 多 个 数据 页 面 存 储 。 

(ij* ORACLE 的 ROWID 则 长 度 比 DB2 UDB 的 RID 的 要 长 。 

(iii)* 对 于 一 个 有 序列 表面 言 ， 在 磁盘 TO 方面 ， 二 分 查找 法 不 比 BH 树 有 效 。 

(ivj* 对 于 一 个 含有 100 万 个 不 同 键 值 的 列表 ， 二 分 查找 法 需要 测试 10 次 才 林 以 找 
到 一 个 键 值 。 

CV)* 假设 内 存 缓 溃 区 中 可 以 存放 1000 个 页 面 ， 我 们 从 100 万 条 记录 中 随机 检索 行 ， 
在 足够 长 的 时 间 后 ， 我 们 有 171000 的 概率 可 以 不 需要 执行 磁盘 TO 操作 就 可 以 
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检索 一 行 。 
(b) 写 出 ORACLE 的 Create Table 语 名 的 STORAGE 子 名 (只 写 出 子 何 )， 使 得 表 的 磁盘 
三 铺 区 大 小 是 10KB ， 在 第 二 次 增长 后 ， 每 一 次 增长 的 容量 是 前 面 一 次 的 两 倍 ， 
当 总 容量 大 于 $120KB 时 停止 ( 即 10+ 10 +20 440 + .+ 2560)、 写 出 计算 过 程 。 
8.7 在 DRACLE 中 ， 有 一 张 表 students 有 400 000 个 行 ， 每 行 的 长 度 是 200 字 节 。 假 设 
已 经 执行 了 下 列 命令 来 装载 students 表 : 
create table students Cstid chart?) not null primary 


KE， ， 。 。 攻 口上 heP columns>} 
pectfree 20: 


(al students 中 的 行 需要 占用 多 少 个 页 面 ? 假设 每 个 页 面 有 2000 个 字 节 。 和 忽略 行 
目录 的 侦 移 量 和 页 面 冻 信息 写 出 计算 过 程 。 
(b)" 假借 stid 上 有 一 个 PCTFREE = 25 的 索引 。 假 设 ROWID 下 用 6 个 字 节 ， 对 于 单列 
的 键 还 项 要 1 宇 节 的 额外 开销 ， 计 算 项 的 大 小 。 然 后 计算 B 树 中 时 子 层 页 面 的 数 
目 。 
(c) 计算 B 树 中 各 个 上 层 中 页 面 的 个 数 。 
{d) 执行 如 下 查询 需要 多 少 次 IO 操作 ? 
select * from students 
where stid between ‘e000 and e020000": 
假设 ， 有 1120 的 学 生 的 eia 值 在 这 个 范围 内 ，stid 上 的 不 是 聚 簇 索引 ， 而 且 没 有 内 存 
缓冲 区 。 
(e) "假设 stid 上 的 索引 是 保全 索引 ， 重 新 计算 (d)。 
(人 在 (e) 的 假设 条 件 下 ， 执 行 下 列 查 询 所 需 的 IO 操作 的 次 数 是 多 少 ? 


select countc*) from students 
包间 它 记 亡 $ 泌 二 E 和 CE OL 


8.8 假设 有 一 个 散 列 组 织 表 ， 每 一 个 页 面 上 可 以 存放 20 行 。 

(a) 散 列 表 中 有 100 000 个 页 面 ， 模 的 个 数 是 多 少 ? 给 出 计算 过 程 

tb) 假设 有 100 000 个 页 面 ， 另 有 100 万 行 散 列 到 这 张 表 中 ， 计 算 散 列 冲突 链表 长 度 
为 21 的 概率 。 给 出 计算 过 程 。 

(c) 如 果 一 行 散 列 到 某 个 页 面 ， 但 是 该 页 面 没有 可 用 空间 ， 该 行 需 要 存放 到 另外 一 
个 页 面 ， 那 么 我 们 称 该 页 面 “溢出 ”。 

多 如 果 某 个 页 面 上 存在 长 度 为 21 的 散 列 冲突 链表 ， 是 否 就 意味 着 该 页 面 洲 出 ? 
(in 某 页 面 洲 出， 是 否 就 意味 着 该 页 面 上 有 长 度 大 于 或 等 于 21 的 散 列 冲 突 链 表 。 
8.9 在 8.6 节 中 ， 我 们 假设 好 个 空位 和 六 个 飞镖 ， 而 且 空 位 中 可 以 容纳 的 飞镖 的 个 数 没 有 
限制 。 

(a 有 10 000 个 空位 和 128 支 飞镖 ， 计 算 被 击 中 的 空位 的 个 数 。 使 用 公式 [8.6.2] 和 
[8.6.41。 注 意 128 是 2 的 宕 ， 所 以 公式 18.6.23] 可 以 通过 连续 自 乘 (1-17M ) 来 计算 ， 
读者 也 应 该 使 用 这 种 方法 。 在 这 两 种 情况 下 ， 被 击 中 的 空位 的 个 数 是 否 都 接近 
于 128 ? 

fb) 假设 有 16 384 个 空位 和 16 384 支 飞镖 ， 重 新 计算 ta)。 注 意 16 384 是 2 的 笑 ， 所 以 
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也 可 以 采取 自 乘 的 方法 来 计算 。 两 个 结果 接近 吗 ? 空 位 被 上 击 中 的 概率 是 否 接 近 
(1-e )? 

(c) 当 有 10 000 个 空位 和 30 000 支 飞镖 的 时 候 ， 利 用 公式 [8.6.51 计 算 没 有 被 而 中 的 空 
位 的 个 数 。 

8.10 (al。 当 我 们 向 靶 上 只 投 丘 一 支 飞 镖 的 时 候 ， 某 个 空位 里 不 可 能 有 两 支 飞 镖 。 当 飞镖 
的 个 数 远 近 小 于 空 位 的 个 数 的 时 候 ， 革 个 空位 中 有 两 支 飞 镖 的 概率 也 很 小 。 但 
是 ， 如 采 纵 定 空位 的 个 数 是 MM， 一 直 投 接 飞 条， 会 在 茶 一 点 出 现 两 支 飞镖 在 同 
一 个 空位 的 概率 大 于 0.5。 计 算 当 村 等 于 365 的 时 候 ， 出 现 上 述 情 况 时 ， 已 投掷 飞 
镖 的 个 数 。( 这 就 是 所 谓 的 “生日 问题 "。 在 一 间 屋 子 里 ,要求 两 个 人 同一 天 生 
日 所 需要 的 人 的 总 数 是 很 小 的 。) 

(tb) [ 难 ] 如 果 空 位 个 数 是 村 ， 再 计算 (a)。 
8.11 (2 在 CAP 的 corders 表 的 month 列 上 创建 一 个 位 图 索引 。 写 出 这 个 脚本 ，。 
(b) 该 索引 的 密度 是 多 少 ? 
(c) 保存 每 个 位 图 需要 多 少 字 节 ? 
(d) 假设 行 是 按 图 2-2 中 行 的 顺序 被 给 定 索引 ， 画 出 'feb' 的 位 图 。 

8.12 (a) 图 6-11 纵 出 了 一 个 数据 库 设 计 的 例子 ， 订 单 是 名 项 的 ( 和 我 们 的 CAP 的 orders 
表 和 不同，ordezres 表 中 订单 是 单项 的 )。 有 一 个 弱 实 体 Line items 通 过 
has_item 联 系 连 按 天 Orders 实 体 。 再 看 看 习题 7.3 太 它 的 管 案 。 数 据 库 CAP 
没有 1ine._items 表 。 要 求 删 除数 据 库 CAP 中 的 表 ， 然 后 写 一 脚本 创建 .- 张 新 
表 orders2a， 该 表 设 有 列 p1id、qgtv 和 qqollars， 但 是 包含 了 其 他 所 有 的 列 。 
该 脚本 还 应 该 创建 customers、agentg 和 product 表 . 另外 还 有 一 张 列 为 
ljineno, ordno,pid,qty 和 dollars 的 表 line_items， 该 家 的 主键 为 
(ordno, 1ineno)。 接 下 来 ， 复制 loadecap 文 件 (复制 为 loadcap2， 这 样 以 后 能 
够 返回 到 该 CAP 数 据 库 的 初始 状态 )， 然 后 编辑 loadcap 包 含 的 交 件 ， 为 这 些 表 增 
加 若干 行使 得 大 密 数 的 订货 行 的 1ine-item 值 为 1， 但 是 对 包含 1000 个 p04 订 货 
的 订单 1011 增 加 1ine_item 为 2。 写 出 一 个 脚本 来 显示 如 何 完成 上 述 工 作 . 

(by (a) 中 的 工作 完成 之 后 ， 删 除 刚才 创建 和 装载 的 表 ， 然 后 在 索引 表 聚 徐 
orderdata 中 重新 创建 表 orders 和 1]ine_item。{ 表 customers 和 agents 
还 是 保留 原来 的 方式 }。 写 出 创建 该 从 艇 中 表 的 脚本 ， 并 说 明 你 如 何 算出 指定 的 
SIZE 值 。 
(0) 在 orders2 表 的 month 列 上 创建 一 个 (辅助 ) 位 图 索引 。 
3.13 ”继续 习题 8.12， 将 表 创 建 为 一 个 合 有 1000 个 散 列 键 的 散 列 这 能 并 完成 装载 。 给 出 
ORACLE 创 建 的 散 列表 的 大 小 。 并 在 month 列 上 增加 一 个 位 图 索引 。 
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回顾 一 下 ， 从 第 8 章 的 开始 就 提 到 的 查询 {8.1.1]: 


select * from Customers 
where city = “Boston and disent between 12 and 14: 


当 一 个 数据 库 系 统 接收 到 这 样 一 个 查询 的 时 候 ， 它 先 通过 一 系列 的 查询 编译 步 双 ， 然 后 
百 开 始 执 行 。 在 第 一 个 阶段 ， 即 语法 检查 阶段 ， 系 统 分 析 查 询 同 时 检查 它 晨 否 符 合 语法 规则 ， 
然后 把 查 吝 语 法 中 的 对 象 朵 视图 、 表 和 在 系统 表 中 的 列 咏 配 ， 接 着 进行 适当 的 查 吝 重 苇 。 在 
这 个 阶段 ， 系 统 确认 用 户 有 正确 的 权限 并 且 老 询 疫 有 违反 任何 相关 的 完整 性 约束 .， 然 后 就 进 
人 查询 优化 阶段 。 在 这 个 阶段 ， 系 统 要 用 到 表 和 列 的 统计 信息 ， 例 如 ， 在 表 中 有 多 少 行 以 及 
通过 它们 各 自 适 当 的 统计 信息 找 出 相关 的 索引 。 这 个 阶段 是 一 个 复杂 的 过 程 ， 我 们 把 它 看 做 
是 “决定 做 什么 "”， 这 个 过 程 的 结果 是 生成 一 个 用 来 执行 查询 的 程序 化 的 存 取 方案 。 然 后 进入 
执行 阶段 ， 在 这 个 阶段 ， 存 取 方 案 被 执行 ， 其 中 系统 通过 存 取 索 引 和 表 从 数据 中 得 出 查询 的 
结果 。 

本 章 的 且 的 是 解释 查询 人 处理 的 一 些 基 本 原理 ,尤其 强调 查询 优化 的 思想 。 对 十 执行 一 个 
给 定 的 查询 ， 通常 有 许多 不 相 上 下 的 存 取 方 案 ， 犹如 在 下 国际 象 究 时 为 了 廉 至少 不 输 1 会 
有 许多 种 下 法 。 系 统 查询 优化 器 竭力 选择 那些 在 减少 各 类 资源 使 用 〈 例 如 ， 磁 盘 IHGO 的 数目 ， 
CPU 时 间 ， 等 等 ) 的 同时 减少 运行 时 间 的 存 取 方 案 。 对 于 一 个 复杂 查询 . 查询 优化 器 可 能 并 
不 选择 最 好 的 可 行 方 案 ， 与 国际 象棋 手下 一 盘 完 美的 比赛 相 比 较 ， 它 香 进 一 步 ， 它 的 目标 是 
在 优化 过 程 中 花 足 够 的 努力 来 确保 一 个 合理 的 好 的 选择 。 查 询 优 化 的 基本 思想 是 如 何 利用 索 
引 、 如 何 利用 内 存 来 积累 信息 和 执行 一 些 中 和 间 步 骤 ， 例 如 ， 排 序 、 如 何 确定 连接 执行 的 顺序 
等 。 通 过 本 章 的 学 习 ， 对 于 一 个 特定 的 查询 ， 读 者 应 当 能 够 列 出 并 且 分 析 由 数据 库 系统 选择 
的 一 个 存 取 方 案 。 读 者 也 应 当 理 解 是 什么 组 成 了 一 个 “好 的 ”或 者 “ 坏 的 ” 存 取 方 案 。 最 后 ， 
读者 就 可 以 更 好 地 理解 DBA【 数据 库 管 理 员 ) 应 当 采 取 的 “调谐 ”步骤 以 提高 查询 性 能 。 例 
如 加 和 索引、 索引 行 的 和 不同 聚 簇 、 表 的 分 解 等 。 

本 章 还 介绍 了 对 于 一 个 给 定 的 SQL 查询 如 何 选择 存 取 方 案 的 许多 考虑 ， 但 是 仅 局 限于 介 
绍 对 于 多 种 可 能 的 方案 为 什么 应 当选 择 一 个 特殊 的 存 取 方 案 ， 而 不 是 介绍 查询 优化 部 筷 样 选 
择 。 通 常 ， 查 询 优 化 器 会 产生 很 兆 可 能 的 策略 ， 并 号 从 中 选取 一 个 ， 而 这 是 一 个 相当 复杂 的 
问题 。 因 为 一 个 计算 机 程序 是 没有 “直觉 ”的 ， 对 于 编写 查询 优化 器 程序 的 编程 者 而 言 ， 创 
建 一 个 高 效 的 决策 程序 并 从 中 选取 合适 的 存 取 方案 是 一 项 很 困难 的 工作 。 这 种 类 型 的 算法 过 
程 { 例如 动态 规划 技术 ) 超出 了 本 文 讨论 的 范围 。 我 们 将 主要 佑 藉 寺 直观 感受 来 说 明 为 什么 
一 个 存 取 方案 比 另 外 … 个 好 ， 同 时 假定 查询 优化 器 通过 算法 搜索 可 以 得 到 相同 的 结果 。 这 种 
方法 通常 用 于 解释 编程 语言 语句 的 效果 上 ， 而 不 考虑 编译 程序 完成 该 效果 的 网 节 。 

OS/390 的 DB2 和 DB2 UDB 直到 现在 ， 我 们 已 经 分 别 从 很 多 不 问 的 数据 库 产品 中 提 上 友 了 
它们 的 特性 ， 但 是 在 本 章 的 余下 部 分 ， 我 们 主要 集中 于 LIBM 的 PDB? 产品 。 在 先前 的 讨论 中 ， 
我 们 已 经 论述 过 DB2 UDB， 它 是 运行 于 UNIX、，Windows NT 上 的 “通用 数据 库 ”， 最 近 艾 在 
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DS7390 的 IBM 大 型 机 上 应 用 。 在 查询 优化 的 讨论 中 ， 我 们 把 注意 力 集 中 于 “老大 哥 ” 产 品 
DB2 for OS/390， 在 本 章 中 ， 简 称 为 DB2， 仅 仅 运 行 于 IBM 大 型 机 的 IBM DS7390 操 作 系 统 上 。 
我 们 相信 不 同 产品 的 结构 差异 对 于 成 功 表达 查询 优化 的 细节 而 言 并 不 重要 。 因 此 在 本 章 中 ， 
我 们 在 集中 竹 述 DB2 的 同时 只 是 偶然 所 及 DB2 UDB 和 ORACLE。 

对 于 查询 优化 ，DB2 已 经 有 一 种 很 复杂 的 方法 。 它 提供 了 很 多 先进 的 执行 特性 ， 它 们 为 
查询 提供 了 高 性 能 ， 这 并 不 是 说 其 他 产品 没有 自己 的 重要 特性 。 查 询 优 化 是 一 个 新 的 领域 ， 
起 源 于 20 世 纪 70 年 代 中 叶 ， 没有 一 个 疡 品 对 于 好 的 思想 具有 获 断 性 。 事 实 上 ， 最 近 的 很 多 研 
究 结 果 提 出 了 新 的 性 能 特性 ， 而 这 些 还 没有 完全 被 集成 到 商业 产品 中 。 本 章 仅 仅 集 中 于 已 经 
在 商业 产品 中 应 用 的 特性 。 本 章 的 最 后 三 节 和 提供 了 一 个 查询 的 基准 测试 程序 (benchmark )， 
它 是 一 个 测试 查询 性 能 的 工业 标准 ， 它 出 现在 本 书 第 1 版 基于 DB2 for OS/390 的 前 一 个 版 本 
MVS DB2 的 介绍 。 基 准 程序 的 测试 以 及 相应 的 具体 查询 存 取 方 案 的 讨论 对 于 增进 读者 对 前 面 
几 节 查询 性 能 原理 的 理解 具有 很 大 的 帮助 。 


9.1 基本 概念 


我 们 先 介 绍 一 些 基本 概念 作为 我 们 讨论 查询 优化 的 基础 。 首 先 考虑 的 是 在 优化 一 个 查询 
时 尽量 使 系统 利用 的 资源 最 小 化 。 最 终 这 个 问题 归结 到 减少 在 计算 机 设备 上 的 投资 和 用 户 的 
时 间 〈 也 醋 以 看 做 是 老板 的 开支 问题 )。 我 们 也 会 考 志 DBA 提 出 的 调谐 数据 库 系 统 的 特殊 要 求 
和 理解 由 查询 优化 器 产生 的 方案 输出 。 

1. 查询 资源 利用 

查询 优化 器 道 过 选取 一 系列 可 供 选 择 的 查询 存 取 方案 中 最 好 的 一 个 来 竭力 减少 对 特定 资 
源 的 利用 。 要 考虑 的 主要 资源 是 CPU 时 间 和 需要 的 MO 数量 。 尽 管 计算 机 内 存 也 是 一 个 重要 资 
源 ， 但 是 不 同 虽 的 的 内 存 容量 通常 在 系统 初始 化 时 就 己 经 确定 。 例 如 ， 在 内 存 中 攻 来 保存 公 
共 磁 盘 页 面 的 缓冲 区 的 数 日 由 PBA 预 先 设 定 。 国 为 查询 优化 器 对 此 无 能 为 力 ， 所 以 ， 它 通常 
通过 在 各 种 内 存 效 值 上 选择 查询 方案 中 的 不 同行 为 ， 凡 一 种 相对 简单 的 方式 来 反映 。 我 们 将 


在 本 章 的 后 面 看 到 这 样 的 例子 。 

相反 ， 在 不 同 的 存 取 方 案 中 执行 查询 
所 使 用 的 CPU 和 ID 资源 是 必须 要 考虑 的 。 
对 于 每 一 个 三 供 选择 的 存 取 方案 都 有 一 个 一 
相关 的 CPU 代价 (用 符号 COSTeautPLAN) 表 
示 ) 以 及 LO 代价 (用 COSTo( PLAN) 表 示 )。 图 9-1 带 有 不 可 比较 的 WO 和 
无 论 何 时 ， 如 果 有 两 个 不 能 比较 的 代价 时 ， CPU 代价 的 两 个 查询 方案 
那么 很 有 可 能 两 个 查询 计划 PLAN, 和 PLAIN 
在 资源 司 用 上 也 是 不 可 比较 的 ， 如 图 9-1 所 示 。 

显然 ,在 较 小 的 CPU 代价 方面 PLAN: 优 于 PLAN, ， 但 是 在 较 小 的 IO 代价 方面 PLAN, 优 于 
PLAN,。 为 了 提供 一 个 使 模糊 性 最 小 的 可 殿 计算 的 简单 方法 ，DB2 查 询 优化 器 定义 了 存 取 方 
案 的 总 代价 的 概念 ， 以 COSTUPLAN) 来 表示 ， 它 是 MO 和 CPU 代价 的 加 权 和 。 

[9.1. 人 COSTIPLANI = WI * COSTHyOIPEAN) + Wy CDSTCEUE PLAN) 

这 里 ，W, 和 W, 都 是 正 数 ， 体 现 了 在 总 代价 中 两 种 代价 的 相对 重要 性 。 优 化 器 的 上 作 就 是 
在 处 理 一 个 查询 的 所 有 可 能 的 方案 中 选择 代价 值 COST (PLAN ) 最 小 的 。 在 下 面 儿 节 中 ， 我 
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们 讨论 怎样 分 析 不 同 的 查询 方案 ， 并 相对 业 确 地 从 中 导出 相应 的 VO 代价 。 单 纯 从 理论 的 角度 
导出 CPU 的 代价 并 个 是 一 件 容易 的 事 ， 因 为 这 依 整 十 CPU 指 令 集 的 细节 和 数据 库 系 统 实现 的 
效率 。{ 当然 ， 对 于 一 个 特定 数据 库 系 统 的 查询 优化 器 而 言 是 可 以 估计 … 个 方案 的 CPU 代价 的 ， 
这 需要 用 到 内 部 函数 所 用 的 CPU 时 间 的 表格 ， 亿 是 这 是 一 个 繁 珊 的 无 类 暴 要 的 细节 ， 因 此 ， 
让 本章 中 我 们 不 涉及 这 个 问题 。 ) 通常 说 来 ， 执 行 一 个 查询 对 于 不 同 的 存 取 方案 CPU 代价 的 变 
化 比 FHO 代 价 变化 要 小 得 和 多， 除 此 之 外 ， 与 每 一 个 MO 代价 相关 的 CPU 代价 芝 常 是 一 个 重要 的 因 
素 ， 央 此 ， 将 UO 代 价 减 到 最 小 的 同时 也 会 将 CPU 代价 减 到 最 小 。 这 意味 着 图 9-1 的 不 可 比较 的 
CPU 和 LO 代价 是 不 通用 的 。 下 面 几 节 主 要 集中 于 BO 代价 的 定量 估算 ， 只 有 当 CPU 代 价 可 能 产 
生 很 重要 的 变化 时 ， 再 以 定性 的 方式 来 讨论 CPU 代价 。 

系统 的 工作 负荷 

我 们 把 -个 系统 的 工作 负荷 定义 为 查询 和 由 系统 用 户 刘 出 这 些 售 询 的 频率 的 结合 尽 。 例 
如 ,我们 有 一 个 查询 系统 ， 它 用 来 帮助 3000 个 保险 调解 员 做 他 们 的 日 常 工作 .也 许 保险 调解 
员 在 他 们 的 工作 中 会 提出 两 种 查询 QI1 和 Q2。 

Ql 检 索 来 自 于 -一 张 使 用 索赔 号 的 意外 索赔 清单 ， 

Q2 检 索 所 有 索赔 号 ， 由 被 保险 人 的 (lastname，firstname } 作为 索引 。 

当 它 们 被 提交 时 ， 这些 查询 对 于 索赔 号 
和 寝 保 险 上 人 人 的 姓名 有 不 同 的 值 ， 但 是 ， 对 于 
这 些 参 数 的 任意 特定 的 值 ， 回 答 这 些 查询 所 
需 的 CPU 和 JTJMO 资 源 几 乎 是 相同 的 。 观 察 了 
调解 员工 作 高 峰 期 的 情形 ， 我 们 注意 到 ， 平 图 9-2 具有 两 个 查询 的 简单 工作 负 匣 
均 说 来 小 组 的 成 员 每 秘 40 次 Q1 类 查询 ，20 次 
Q2 类 查询 。 这 样 的 频率 可 用 图 9-2 反 上 观 。 当 然 ， 这 只 是 工作 负荷 的 一 个 简单 的 例子 ; 在 实际 生 
活 中 ， 可 能 有 更 多 类 型 的 查询 和 更 少 的 具有 精确 数字 的 提交 率 。 

对 于 一 个 系统 上 给 定 的 工作 负荷 以 及 由 查 淘 优 化 器 产生 的 镍 对 工作 负荷 中 的 查询 生成 的 
查询 忠 行 方案 ， 可 以 计算 每 秒 需 要 的 CPU 和 TO 资源 。 从 这 一 点 以 及 一 个 设备 费用 的 列表 中 我 
们 可 以 把 需求 转换 为 看 上 去 更 为 直接 的 度量 ; 为 了 支持 工作 负荷 需要 的 系统 的 美元 费用 。 例 
如 ， 考 虑 一 个 工作 负荷 ， 它 有 一 个 出 现 频 度 很 高 的 查询 ， 用 到 大 约 1000 次 VO 但 是 很 少 有 CPU 。 
开始 ， 我 们 注意 到 我 们 有 相对 长 的 响应 时 间 (每 种 只 能 执行 50 个 随机 的 IO， 在 一 个 查询 方案 
中 ， 后 续 的 LO 必须 等 待 以 前 的 MO 完成 )。 在 这 样 的 工作 负荷 下 ,尽管 我 们 可 以 购买 相对 便宜 
的 CPU， 我 们 也 许 需 要 购买 大 量 磁盘 来 提供 需要 的 11O 存 取 速 率 。 在 选取 大 一 些 或 小 一 些 的 
CPU 系 统 方 面 我 们 通常 有 很 多 自由 度 。 例 如 ，IBM 大 型 机 数 年 来 一 直 保 持 着 CPU 计 算 能 力 和 和 
产品 价格 的 线性 增长 关系 〔 当然 其 中 有 些 是 人 为 的 因素 )。 

所 有 这 些 要 购买 的 东西 都 需要 事先 规划 好 ， 这 就 是 为 什么 DBA 在 一 个 应 用 实现 之 前 就 竟 
力 要 得 到 工作 负荷 估算 的 原因 。 工 作 和 负荷 中 的 每 一 个 查询 都 根据 其 峰值 频率 和 资源 使 用 被 换 
算 为 计算 机 硬件 上 的 费用 ， 也 就 是 所 用 设备 的 “合理 租金 "。 很 长 的 响应 时 间 世 是 一 种 花 销 ， 
主要 是 六 为 公司 需要 雇佣 更 多 的 雇员 (雇员 用 来 等 待 响应 的 时 间 通 常 是 被 浪费 的 )， 还 内 为 过 
长 的 等 竺 会 使 麻 员 在 泪 表 中 辞职 从 而 增加 人 员 流 动 率 。 以 这 种 方式 来 看 ， 如 果 我 们 可 以 提高 
查询 优化 英 的 性 能 ， 使 它 可 以 证 多 种 存 取 方案 中 选取 一 个 更 好 的 ， 那 么 马上 就 会 节省 费用 。 
对 于 DBA 而 音 ， 这 是 一 个 需要 研究 的 至 关 重 要 的 领域 。 


每 秘 钟 的 提交 率 
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2. 收集 统计 信息 
任何 精致 的 查询 优化 器 都 需要 得 到 它 处 理 的 不 同 的 表 、 列 和 索引 的 统计 信息 。 例 如 ， 调 
用 如 上 查询 : 
select * rom tustomers 
where city = 'Boston’ and discnt between 12 end 14: 


如 果 customers 表 在 一 简单 的 数据 页 上 仅 包 含 3 列 ,那么 查询 优化 器 应 当 忽 略 任何 现存 
的 索引 而 进行 一 次 表 扫 描 一 一 对 于 列 的 直接 搜索 一 一 来 使 这 两 个 谓词 的 条 件 得 到 满足 。 男 一 方 
面 ， 如 果 在 10 000 数 据 页 面 上 有 100 000 列 ， 那 么 查询 优化 如 将 通过 使 用 在 city 或 Gi scnt 上 
的 索引 来 节省 资源 ， 如 果 这 些 索 引 存 在 的 话 。 为 了 计算 资源 的 费用 ， 查 询 优 化 器 需要 进行 佑 
算 ， 例 如 ， 当 cicty='Boston 时 有 多 少 行 。 如 果 对 于 cicy 列 【和 值 是 Bostonm ) 只 有 一 全 值 ， 那 
冬 所 有 的 列 都 是 这 个 数值 ， 查 询 优化 器 就 知道 这 个 索引 没有 任何 用 处 。 我 们 将 在 下 面 几 节 考 
虑 具体 的 统计 信息 。 

当 一 个 表 装 入 内 存 和 创建 索引 的 时 候 ， 统 计 信 息 不 是 煞 目 动 地 收集 的 ， 必 须 由 DBA 给 出 
特定 的 命令 ， 这 些 命令 就 是 收集 需要 的 统计 信息 并 把 结果 放 入 系统 表 的 命令 实用 程序 。 在 表 
上 的 更 新 会 导致 在 统计 信息 上 没有 反映 出 来 的 变化 ， 统 计 信 息 会 因此 过 时 ， 如 果 没 有 是 够 频 
繁 收 集 统计 信息 的 命令 的 确保 ， 也 许 会 导致 查询 优化 器 不 恰当 的 决定 。 

DB2 使 用 RUNSTATS 命 令 (语法 如 图 9-3 所 示 ) 来 把 统计 信息 放 人 目录 表 中 。RUNSTATS 
命令 的 最 简单 的 形式 【以 CAP 数 据 库 为 例 ) 如 下 : 

runstats on table poneil .customers; 


实际 上 能 够 检索 到 我 们 需要 的 绝 大 多 数 统计 信息 。 详 细 组 节 将 在 下 面 儿 节 中 叙述 。 


RNSTATS ON TABLE username,tablename 
[WITH DISTRIBUTION CAND DETAILED] {INDEXES ALL | INDEX indexname}} 
Lother clauses not covered or defearred] 


图 9-3 DB2 的 RUNSTATS 命令 语法 


ORACLE 使 用 Analyze( 分 析 ) 请 句 收集 统计 信息 ， 并 将 其 放 入 数据 字典 中 。 分 析 语 句 的 语 
法 如 图 9-4 所 示 。 


ANALYZE 二 INDEX | TABLE | CLUSTER} [schema.] findexname | tablename | clustername)} 


{COMPUTE STATISTICS | other alternatives not covered! 
{FOR TABLE | FOR ALL CINDEXED] COLUMNS [SIZE n] | Other alternatives not COvered ] 





图 9-4 ORACLF 的 Analyze 语 名 请 法 


3. 检索 查询 方案 

查询 优化 器 建立 一 个 存 取 方 案 包 含 一 系列 过 程 存 取 步 驮 ， 或 者 简称 过 程 步 最 或 存 取 步 又 。 
这 些 过 程 步 骤 依 赖 于 特定 的 数据 库 系 统 ， 并 像 在 对 象 程序 中 由 编译 程序 产生 的 用 以 折 行 高 层 
次 程序 (在 这 里 是 非 过 程 性 SQL 查 询 ) 人 逻辑 的 一 系列 指令 一 样 放 在 一 起 。 在 下 面 儿 节 中 ， 我 
们 将 讨论 PDB2 中 的 存 取 步 又 ， 其 中 包括 : 

* 表 空 间 扫 描 《在 DB2 中 或 者 在 DB2 UDB 中 的 表 扫 质 )。 

* 索引 扫描。 


i 


386 发 据 床 原理、 镁 积 与 性 能 


“等 价 唯一 索引 查找 。 

" 非 于 秘 匹 配 索 引 扫描 。 

* 虞 禾 匹配 索引 扫描 。 

* 仅 使 用 索引 的 扫描 . 

大 多 数 数据 库 系 统 都 石 -- 个 类 似 的 过 程 步骤 然而， 即使 是 具有 烽 似 名 字 的 步 又 对 于 不 
同 的 数据 库 系 统 也 有 不 同 的 影响 ， 这 样 就 需要 不 同 的 过程 流程 ， 它 十 分 类 似 十 不 同色 理 髓 的 
机 咯 指 令 。 尽 管 DB2 不 提供 位 图 索引 和 散 列 存 取 ,但 是 这 个 产品 具有 完善 的 过 程 步 又 的 集合 
并 且 冯 持 在 其 他 系统 中 拥有 的 绝 大 多 数 存 取 概 念 ， 语 时 拥有 许多 有 价值 的 高 性 能 的 能 力 ， 这 
种 能 力 在 范围 检索 方面 尤其 有 价值 。 

对 于 一 :个 给 定 的 查询 ，DBA 使 用 由 数据 库 系统 提供 的 命令 来 产生 查询 方案 。 在 DB2 UDB 
中 ，DBA 使 用 如 下 形式 的 特殊 形式 的 SQL 语句， 

EXPEAIN PLAN [SET QUERYNO = 站 [和 ET QUERYTASG = “$string'"] 

FOR explainatble-. sdl -statement: 

这 个 语句 可 以 在 (大 型 机 亢 的 】) DB2 和 DB2 UDB 上 正确 执行 。 在 DB2 的 情况 下 ， 它 把 行 
插 人 到 用 户 创 建 的 各 为 plan_table 的 DB2 表 中 ， 其 中 每 一 行 代表 为 由 
explainable sql_sEatement 创 建 的 计划 中 的 每 一 个 独立 的 存 取 步 骤 。 在 DB2 UPB 情 况 
下 ， 它 插入 被 称 为 explain tables( 解 释 表 ) 的 用 户 创建 表 的 集合 中 。 我 们 在 下 面 的 讨论 中 
将 避免 计 论 相对 复杂 的 DB2 UDB 解 释 表 ， 除非 提 到 我 们 将 介绍 的 所 有 PB2 的 简单 能 力 在 DB2 
UDB ( 和 ORACLE ) 中 有 反例 。 在 Explain Plan( 解 释 方案 ) 语 句 指定 的 queryno 是 在 DB2 中 表 
plan._table 的 一 列 ， 因 此 它 可 以 作为 从 表 plan_table 中 查询 带 有 规定 值 n 的 检索 这样 
DBA 就 可 以 执行 下 列 语句 从 而 产生 我 们 已 经 作为 例子 的 查询 的 查询 方案 : 


explain plan set queryno = O00 for 
splect * from cuUstomers 
where city = ‘Hoston’ and discnt between 12 and 14: 


然后 从 DB2 的 表 plan_table 中 检索 与 此 查询 (在 本 情况 中 只 有 -个 ) 有 关 的 所 有 行 ， 然 后 ， 
DBA (或 者 拥有 产生 计划 的 感 兴趣 的 使 用 者 ) 可 以 执行 语句 : 

select * from plan_ table where queryna = 1000: 

表 plan_table (有 时 我 们 简称 为 方案 表 ) 含有 大 量 的 列 ， 事实 上 在 第 一 次 遇 到 时 列 的 
数量 是 惊人 的 .， 当 这 些 列 与 论述 的 内 容 相 关 时 ， 我 们 将 这 些 列 的 重要 性 ,但 是 作为 介绍 ,我 
们 只 涉及 到 -一 个 各 为 ACCESSTYPE 的 重要 列 。 在 DB2 方 案 中 ,一 次 表 宇 间 扫 描 步 又 将 扫描 存 
情 该 查询 的 单个 表 的 行 的 一 个 表 空 间 《 也 可 能 是 出 现在 同 -页 面 上 的 来 自 于 其 他 表 的 行 ， 就 
像 在 ORACLE 的 聚 艇 中 那样 ;， 户 时 确认 与 那 张 表 相关 的 WHERE 子 名 的 搜索 条 件 。 当 这 个 时 
候 ， 我 们 可 以 看 到 在 表 plan_rable 的 ACCESSTYPE 列 上 有 一 个 'R'， 在 下 面 几 市 中 我 们 用 
ACCESSTYPE=R 来 表示 。 表 blan_table 的 另外 一 列 将 给 出 扫描 执行 的 表 的 名 称 。 

需要 注意 的 是 ， 原 始 的 Select 语 句 可 以 用 在 From 子 句 中 视图 表 名 上 ， 而 存 取 方 案 中 用 到 的 
只 是 物理 的 基 李 表 。 我 们 在 先前 介绍 的 大 多 数 方 案 包 含有 单个 步 名 ， 这 样 在 方案 表 中 就 只 有 
一 行 出 现 。( 每 - -个 单 次 存 取 方案 步骤 仅仅 指 单 个 表 ， 内 此 在 FROM 子 句 中 涉及 到 铸 于 -一 个 表 
的 情况 时 ， 就 需要 多 此 方 案 ， 或 者 因 鸭 连接 运算 或 者 因为 一 系列 六 查 询 。) 为 外 一 个 
ACCESSTYPE 对 应 于 一 个 方案 步骤 ， 其 中 一 个 单个 的 索引 用 于 限定 检索 才 的 行 。 例 如 ， 一 个 
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cityx 索 引用 于 检索 所 有 满足 滑 间 city='Boston' 的 谓词 的 行 ， 同 时， 在 WHERE 子 名 中 不 被 
那个 索引 (如 discnt 在 10 和 20 之 间 ) 版 定 的 任何 谓词 在 限定 的 行 被 序 取 后 被 确认 。 对 于 这 种 
类 型 的 方案 我 们 可 了 以 在 方案 表 中 看 ACCESSTYPE=I。 

在 ORACLE 中 ， 对 于 一 个 特定 的 查询 的 方案 可 以 放 在 缺 省 的 plan_table 中 或 者 任何 其 
他 的 带 有 相同 列 的 命名 表 中 ， 用 一 个 党 有 下 列 滞 法 的 语种: 


EXPLAIN PLAN [SET STATEMENT TD = ‘text-identifier'] LINTO [schema.]tablename] 
FOR explainabie-sql-statement: 


Explain Plan 语句 出 现在 《ORACLE8S Server SQOL Reference》( 推 荐 该 物 [9]) 中 。 要 获得 关 
于 怎样 解释 一 "个 执行 方案 的 信息 ， 参 见 《ORACLE8 Server Tuning Guide 》( 推 荐 读物 [8]) 的 第 
21 章 。 


9.2 表 空 间 扫 瓜 和 WO 代价 


作为 我 们 的 过 程 存 取 步 又 研究 的 开始 ， 我 们 先 考 虚 在 DB2 中 的 表 空 间 扫 描 。 问 右 一 下 ， 
在 代表 一 -个 表 空 间 扫 描 的 方案 表 中 的 行 在 ACCESSTYPE 列 上 有 字母 R， 我 们 写 为 


ACCESSTYPE=R. 


例 9.2.1 ” 表 空 间 扫 描 步 骤 DB2 中 的 表 空 间 扫 描 步 又 是 一 个 算法 步骤 ， 其 中 ， 一 个 表 
( 以 及 相应 的 表 空 间 的 数据 页 面 ) 中 的 所 有 数据 被 扫描 ， 同 时 ， 表 中 的 行 被 在 wHERE 子 句 中 
搜索 条 件 的 相关 谓词 限定 。 在 DB2 框 保 中 ,来自 于 不 同 表 的 行 可 以 混合 刘 一 个 表 空 间 的 共 疗 
区 域 上 上， 这 就 是 为 什么 我 们 把 它 称 为 表 空 间 扫 描 而 不 是 表 扫 播 的 原因 。 然 而， 在 下 面 的 内 容 
由， 我 们 假定 被 一 次 表 空 间 扫 描 引 用 的 所 有 页 仅仅 包含 米 自 于 一 个 表 的 行 。 

假定 我 们 有 一 张 有 200 000 行 的 表 emp loyees， 每 行 200 字 节 ， 辣 时 数据 页 面 装载 70% 
( 在 DB2 中 ， 确 定 全 部 数据 页 面 怎 样 被 缺 省 地 装载 的 PCTFREE 说 明 在 Create Tablespace 语句 中 
给 出 ,也 可 以 在 Create Table 语 句 中 被 重 写 )。 我们 假定 每 一 个 4KB 页 面 在 头 部 大 约 用 96 个 字 节 ， 
留 下 4000 字 节 ， 装 载 70%， 即 我 们 有 2800 字 节 可 以 使 用 ， 因 此 每 个 页面 可 以 装载 14 行 。 这 样 ， 
对 于 200 000 行 ， 需 要 的 数据 页 面 的 总 数 是 CEIL(200 000/14=14 286 页 。 现 在 考虑 下 面 的 碍 和 刹 : 


select eid, ename From empl oyees where strsecno 一 113353179; 


这 个 查询 将 此 检索 一 个 具有 给 定 社会 保障 导 的 一 个 雇员 。 如 上 集 我 们 设 有 一 个 关于 socsecno 
的 素 引 ， 那 么 我 们 能 做 的 就 是 用 一 次 表 空 间 扫描 来 扫描 整个 表 ， 寻 找 符 侣 WHERE 子 名 描述 的 
所 有 行 。( 我 们 假定 满足 条 件 的 只 有 一 行 ， 但 是 ， 仿 赖 于 搜集 的 统计 信息 查询 优化 器 也 许 不 知 
道 这 个 情况 。) 注意 ， 数 据 打 描 步骤 事实 上 是 存 取 方案 的 全 部 ， 国 为 这 个 步骤 的 结果 完全 回答 
了 查询 。 在 本 表 中 有 14 286 个 数据 页 面 ， 因 此 本 方案 的 MO 代 价 ，COSTuo( PLAN) 为 14 286 次 
读 ， 也 就 是 14 286 次 随机 的 WO。 我 们 曾经 说 过 ， 我 们 不 必 居 算 COSTcw,(PLAN), 但 是 可 以 很 
设 整 个 的 代价 同 110 的 代价 是 成 正比 的 。 国 


表 空 间 扫 描 存 其 他 产品 中 会 有 其 他 的 和 名称。 例如 ， 直 禄 搜索 、 数 据 扫 描 或 者 表 扫 描 。( 囊 
实 上 ， 在 DB2 UDB 中 被 称 为 表 扫 揪 ， 因 为 每 一 个 页 面 仅 包含 来 自 于 一 个 表 的 行 。) 例如 ， 我们 
在 前 面 讨 论 过 ， 在 例 8.4.1 中 ， 有 关于 执行 大 量 随机 的 WO 所 需要 的 时 间 。 现 在 ,我 们 可 以 检查 
一 些 我 们 用 来 计算 执行 时 间 的 假设 了 ， 则 时 介绍 一 些 新 类 型 的 MO， 它们 被 称 为 顺序 预 取 1OD 和 和 
列表 预 取 LO。 
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LO 代价 的 居间 

对 于 例 9.2.1 的 查询 方案 ， 我 们 可 以 从 14 286 次 读 的 WO 代价 中 得 到 什么 暗示 呢 ?” 曾 经 讲 过 
在 一 个 普通 的 磁盘 上 一 次 随机 的 VO 执行 的 时 间 大 约 为 0.0125 秘 (一 秒 钟 的 1780 )， 谣 像 我 们 和 在 
8.2 节 见 到 的 那样 ,但 是 这 并 不 意味 着 顺序 的 14 286 次 随机 WO 需要 的 时 间 为 14 286/80=178.6 秒 。 
很 有 可 能 的 情况 是 ， 这 14 286 个 数据 页 面 可 以 被 分 布 放 在 10 个 不 问 的 磁 片 上 ， 系 统 可 以 使 得 
十 个 活动 艾 上 的 伐 头 同时 移动 ， 因 此 每 -个 磁 片 只 是 将 1110 的 页 面 装载 入 内 存 ( 每 磁 片 1429 
个 页 面 )， 这 上 只 需要 原来 时 间 的 1710 (17.9 秒 )。 这 种 使 多 个 活动 臂 的 磁头 在 一 个 查询 中 国 时 行 
动 的 方法 叫做 IO 并 行 性 《LO parallelism )。 因 为 在 查询 方案 中 ，CPU 时 间 远 远 小 于 磁盘 I1O 请 
求 的 时 间 ， 我 们 期 望 CPU 能 够 跟 得 上 检索 来 自 于 数据 页 面 中 相应 行 的 速度 ， 这 个 速度 同系 统 
把 页 面 从 磁盘 读 人 内 存 缓冲 区 的 速度 林 同 ， 它 以 大 量 并 行 移动 的 磁盘 活动 臂 并 发 地 占用 CPU 
上 时间] 。 当 然 ， 这 样 的 并 行 恋 计 不 需要 额外 的 CPU， 但 是 它 很 明显 地 降低 了 查 阁 的 时 间 。 

{1) IO 并 行 性 和 磁盘 分 杀 

IO 并 行 性 是 好 斤 个 数据 库 系 统 都 提供 了 的 特征 。 例 如 ， 一 些 系统 提供 了 把 数据 页 面 在 10 
个 不 同 的 磁 益 上 进行 分 条 的 能 力 ， 第 1 个 页 面 在 磁盘 1 上 上， 第 2 个 页 面 在 磁 夫 2 上，…… ， 第 10 个 
页 面 在 磁盘 10 上 ， 然 后 第 11 个 页 面 在 磁盘 1 上 ， 第 12 个 页 面 在 磁盘 2 上 ，…… ， 第 N 个 页 血 在 伴 
盘 ((N - 1)%10)+1 上 。(“X9%Y” 就 是 “X MOD Y” 的 CC 语言 表达 式 ， 参 见 图 9-5)。 当 我 们 以 这 
种 方式 把 页 进行 分 条 时 ， 从 一 个 表 中 读 取 连续 页 面 的 系统 可 以 把 客 次 VCO 读 请 求 放 到 以 后 ， 这 
样 就 可 以 保持 所 有 的 磁盘 臂 在 大 多 数 的 时 间 都 忙碌 。 因 为 当 热 行 : -次 表 空 间 扫描 时 我 们 串 以 很 
容易 地 预测 将 来 的 表 空 间 页 请 求 ， 我 们 仅仅 需要 :一 个 支持 分 条 的 结构 把 收 辑 页 和 面 地 址 翻 详 成 在 
多 个 磁盘 上 的 物理 设备 地 址 ， 同 时 把 以 后 的 WO 请 求 传 到 适当 的 设备 。 这 件 举 根 本 不 财 难 ， 因 
为 在 这 样 -- 个 分 条 结构 下 ， 被 分 配 的 区 域 必须 以 一 种 很 好 定义 的 上 方式 跨 这 多 个 磁盘 ， 





图 9-5 在 分 条 的 磁盘 上 连续 的 磁盘 页 面 


有 很 多 原因 可 以 说 明 为 什么 对 并 行 LO 进 行 分 条 没有 被 广泛 采用 。 当 然 ， 它 竺 要 DBA 增 
析 额 外 的 工作 ， 他 必须 在 多 个 磁盘 上 分 配 等 量 的 空间 。 平 衡 磁 盘 臂 负荷 以 获得 最 大 的 并 行 性 
也 是 一 个 复杂 的 问题 : 如 果 在 工作 负荷 中 ， 十 个 硫 盘 中 有 一 个 进行 IO 读 取 时 极 跨 忙碌 ， 那 
么 那个 磁盘 就 会 成 为 并 行 存 取 的 一 个 瓶颈 ， 也 许 会 导致 在 分 条 的 表 空 间 中 的 其 他 磁盘 不 能 充 
分 利用 。 再 有 ， 许多 系统 没有 足够 的 磁盘 设备 或 者 一 个 足够 大 的 应 用 程序 来 要 求 并 行 扫 描 对 
于 这 种 情况 进行 协调 。 

另外 一 点 就 是 磁盘 分 条 实际 上 并 没有 节省 任何 计算 机 资源 花费 。 即 使 开 作 负 背 被 分 裂 到 
几 个 不 间 的 磁 扒 设备 中 ， 我 们 还 是 要 求 相同 数量 的 随机 11O。 如 果 我 们 通过 对 磁盘 设备 在 运行 
期 间 收 取 合 理 租金 的 方式 来 估算 例 9.2.1 中 14 286 次 随机 IO 的 IO 代价 .那么 在 这 个 费用 上 ， 并 
行 性 不 起 作用 ; 我 们 只 能 够 用 更 多 的 设备 来 换取 更 少 的 时 则 ， 同 时 何 相 同 的 费用 。 对 于 但 痊 
入 省 下 来 的 时 间 可 以 应 付 先 前 提 到 的 雇员 的 费用 、 减 少 浪 费 的 时 间 以 及 因为 等 待 查 词 结 末 的 
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沪 开 而 造成 众 员 的 辞职 。 因 为 HO 并 行 性 相对 说 来 很 少 ， 我 们 在 下 面 的 讨论 中 假定 我 们 总 是 血 
临 串 行 WO 这 样 - :种 选择 ， 即 第 二 个 请 求 只 有 在 第 一 个 IO 请 求 被 完成 以 后 才能 放 人 一 个 方案 
中 ， 除 非 我 们 另外 规定 。 然 而 ， 对 于 串 行 MO 依然 有 -- 个 未 公布 的 技巧 ， 它 实际 上 在 执行 -- 个 
表 空 间 扫 摘 时 可 以 节省 大 量 的 资源 。 

(2 DE2 中 的 顺序 预 取 IO 

我 们 己 经 隐 售 地 假定 当 一 :个 接着 - -个 执行 14 286 次 读 (随机 IO ) 时 将 需要 单个 随机 的 WO 
时 人间 的 14 286 倍 。 在 8,2 节 ， 我 们 推出 一 个 事实 ， 单 个 随机 的 WO 时 间 平 均 为 0.0125 秒 ， 在 图 9-6 
中 星 这 段 时 间 的 分 解 。( 我 们 对 于 8.2 节 的 分 析 中 的 DB2 的 4KB 页 面 没 做 任何 修改 )。 


寻 道 时 间 0.0080 种 
旋转 延 时 0.0040 种 


传输 时 间 0.0005 秘 {一 次 传输 4KBY 
总 上 共 .0125 和 4 和 





图 9-6 DB2 的 随机 LO 时 间 的 分 解 


现在 让 我 们 Io| 公 一 次 表 空 间 扫描 中 执行 14 285 次 IO 时 的 考虑 。 由 十 区 域 在 磁盘 介质 上 被 
分 配 的 方式 ， 我 们 通常 会 发 现 表 中 连续 的 真 面 在 芒 盘 上 也 是 连续 的 ， 连 续 的 页 面 处 于 相同 的 
磁 关 。 这 意味 普 ， 对 于 来 白 于 一 个 表 中 连续 的 数据 页 面 的 IO 代价 中 ， 它 通常 不 合 有 赃 盘 臂 从 
一 个 柱 面 移动 到 另外 一 个 柱 面 的 导 道 时 间 。 让 我 们 回忆 在 8.2 节 开始 时 的 讨论 ， 在 磁盘 迟 的 寺 
道 时 辣 中 ， 大 约 0.016 秘 为 平均 的 寻 道 时 间 ， 其 中 假定 连续 存放 的 页 面 被 随机 存放 在 两 个 端的 
性 面 位 颖 上 。 在 我 们 现在 的 情况 中 ， 通 常设 有 要 移动 的 距离 ， 我 们 可 以 认为 寻 道 时 间 完 全 消 
失 .. 事实 上 ,不 看 起 来 好 像 旋转 的 延迟 时 间 也 一 并 消失 ， 因 为 通常 我 们 是 按 顺 序 一 个 磁盘 页 
面 - -个 磁盘 页 面 进 行 检 索 。 这 样 ， 看 上 去 似乎 把 连续 的 数据 页 面 放 人 内 存 缓冲 区 需要 的 正常 
时 间 不 能 以 完全 传输 率 进行 的 说 法 没有 理由 ， 这 个 速度 对 于 4KB 的 页 面 大 约 为 0.00125 秒 。 在 
本 书 的 第 1 版 中 ， 对 于 这 样 的 分 析 有 很 多 争议 ,因为 前 一 页 被 返回 以 后 ， 对 于 磁盘 上 下 一 页 的 
请 求 将 由 于 时 间 过 长 ， 以 致 于 磁头 不 经 过 磁盘 上 完全 旋转 的 这 段 时 间 就 不 能 够 检索 到 下 一 页 ， 
因此 必须 加 上 大 约 为 8ms 的 旋转 延 时 。 但 有 是， 最近 在 数据 库 系 统 并 行 性 方面 有 了 新 的 发 展 ， 
它 使 得 控制 器 可 以 不 等 待 先前 的 请 求 被 填 满 就 执行 连续 的 请 求 ， 这 些 发 展 使 得 在 大 多 数 情况 
下 进行 这 种 高 速 的 顺序 IO 成 为 可 能 。 

事实 上， 磁盘 控制 器 通常 支持 的 一 种 通用 的 缓冲 区 技术 加 强 了 这 种 分 析 、 通 过 这 样 一 个 控制 
器 ， 无 论 什 么 时 候 请 求 一 个 磁盘 页 面 的 HO，ZO 总 要 执行 于 含有 被 要 求 的 磁盘 页 面 的 整个 磁道 上 . 
来 自 于 磁道 的 数据 被 缓冲 到 由 信 盘 控制 器 拥有 的 内 存 中 去 ， 被 请 求 的 单个 页 面 返回 给 数据 库 服 务 
回 。 然 而 , 如 果 以 后 对 于 页 面 的 请 求 还 是 在 相 则 的 硫 道上 (就 像 它 们 在 一 个 表 空 间 扫描 的 情况 下 )， 
那么 数据 从 位 盘 控 制 器 的 缓冲 区 中 读 出 并 立即 被 返回 到 数据 库 的 服务 器 上 ， 而 不 必 对 磁盘 进行 存 
取 。 所 以 ， 在 第 -- 次 寻 道 之 后 VO 的 速度 几乎 是 瞬时 的 。 磁 盘 控 制 器 每 次 检索 一 个 磁道 ， 这 样 就 把 
一 个 顺序 IO 变 为 一 个 比 跑 机 TO 几乎 快 十 倍 的 BO 速度 ! 在 图 9-7 中 我 们 显示 这 种 加 速 后 的 顺序 11O。 

当 单 个 爸 盘 页 面 被 请 求 时 ， 美 于 读 人 整个 磁道 并 且 放 人 绿 溃 区 的 磁盘 控制 器 特性 的 一 个 
问题 是 : 这 一 点 总 要 发 生 ， 即 使 在 它 达 不 到 目的 的 时 候 。 因 此 读 人 整个 矿 道 的 0.008ms 的 时 间 
总 是 被 加 到 由 数据 库 执行 的 每 一 个 HO 中 去 ， 其 至 也 加 到 随机 的 WO 中 来 拾取 那些 对 于 存 取 该 磁 
道上 的 下 -个 页 面 无 用 的 行 。 


Th 
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计 道 时 间 0.00050 种 《 尘 于 一 个 磁道 的 细 注 攻 遂 时 了 ) 
旋转 延 时 0.00025 种 【仍然 天 要 等 待 要 求 的 ， 被 组 冲 的 第 一 页 ) 


传输 时 间 0.00050 秒 (一 次 传输 4KB) 
总 共 0.00125 种 





图 9-7 平均 的 顺序 WO 时 间 的 分 解 


DB2 系 统 提 供 了 一 个 易于 及 时 回答 的 IO 请 求 ， 被 称 为 顺序 预 取 TO. 顺序 疯 到 J/O 的 思想 
绒 是 系统 指定 了 按 序 从 磁 抢 上 读 人 大 量 数 据 页 ， 通 常 是 32 页 ,但 是 仅仅 在 需要 的 时 候 ， 就 像 
存 我 们 稍 后 看 到 的 那样 ，DB2 也 花费 了 很 多 努力 来 确定 可 能 的 时 收 怎 样 按 序 放置 11O 请 求 。 结 
果 ，DB2 可 以 在 磁盘 的 全 速 旋 转 传输 速率 中 按 序 执行 32 个 负面 读 ， 即 使 在 磁盘 控制 器 磁道 组 
存 能 力 被 关 团 的 时 候 也 能 如 此 。 这 些 都 归结 为 : 顺序 的 天 量 精 的 检索 在 速度 上 大 大 超过 随机 
LO， 就 像 我 们 在 图 9-8 中 所 描述 的 那样 。 


随机 LO 顺序 害 取 DO 
(以 秒 为 单位 ) (以 秘 为 单位 } 


每 个 页 面 总 共 消 耗 的 时 间 0.0125 0.00125 





图 9-8 顺序 预 取 和 随机 LO 的 时 间 的 比较 


下 面 我 们 用 简单 的 经 验 规则 来 说 明 ， 在 可 以 应 用 顺序 预 取 的 场合 ， 它 在 速度 上 十 倍 十 随 
机 WO， 它 的 速度 是 每 秒 800 次 WOQO， 也 就 是 说 ， 每 次 LW1O 为 0.00125 秘 ( 即 1.25ms )。 


例 9.2.2 带 有 顺序 预 取 的 洁 空 间 扫 描 ”回忆 例 9.2.1 的 表 空 间 扫描 ， 其 中 给 定 的 Select 语 名 
具有 14 286 次 RR 的 LO 代 人 和 价 《RR 代表 随机 WO )。 在 标准 的 随机 IO 假设 下 (无 并 行 性 )， 我 们 计算 
这 个 查询 执行 的 时 间 ， 期 间 一 个 磁盘 臂 被 完全 使 用 ， 那 就 是 14 286/80=178.6 秒 。 事 实 上 ， 因 
为 在 一 次 表 空 间 扫 描 中 的 磁盘 页 面 请 求 能 够 以 连续 方式 被 完成 ，LO 将 被 执行 得 更 快 。 我 们 
写 为 COST,o(PLAN) = 14 286S。 被 读 人 的 页 面 数 量 未 端的 字母 $ 抄 出 页 面 是 连续 的 并 有 旦 在 
DB2 中 采用 顺序 预 了 到。 这 个 查询 的 时 间 是 14 286/800=17.86 秒 。 这 是 一 个 重要 的 MO 费用 的 季 
省 ， 困 为 花 在 磅 冀 余 上 的 时 间 实 际 上 已 经 被 减 小 了 十 倍 ， 因 此 在 设备 上 的 租金 也 同时 减 小 了 
相同 的 因子 。 从 另外 一 他 角度 看 ， 在 相间 的 磁盘 上 我 们 用 顺序 预 取 的 方法 可 以 执行 十 倍 于 随 
机 TIO 的 查询 。 图 

一 个 查询 也 许 会 同时 用 到 顺序 预 到 /GQ 和 随机 I1O。 我 们 把 总 的 11O 耗 时 作为 最 好 的 通用 衡 
量 标 准 ， 因 为 在 磁盘 辟 上 的 租金 司 磁盘 壁 在 使 用 中 的 耗 时 直接 成 正比 ， 所 以 在 这 个 重要 的 意 
义 上 ， 顺 序 预 取 TO 比 跑 机 TO 效率 提高 十 倍 。 

现在 是 介绍 DB2 方 案 表 中 另外 一 个 列 的 好 时 机 ， 这 个 
列 为 PREFETCH 列 。 当 对 于 一 个 给 定 的 存 取 步 最 选择 了 顺 
序 预 取 时 候 ， 我 们 会 看 到 那个 方案 表 的 行 上 的 PREFETCH 
列 有 字母 8$， 我 们 把 这 种 情况 写 为 PREFETCH=S$.。 这样 ， 图 9-9 例 98.2.2 的 方案 去 
例 9.2.2 中 的 表 空 间 扫 描 步 骤 在 DB2 方 案 表 中 写 为 
ACCESSTYPE=R、PREFETCH=S$。 仅 列 有 这 两 列 的 方案 表 在 图 9-9 中 给 出 ， 

(3) 列表 预 取 
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在 DB2 中 ， 还 有 一 种 预 取 方 式 称 为 列表 预 取 ， 在 这 种 预 取 方式 中 ，--- 系 列 需要 恋人 内 人 在 
缓冲 侈 的 页 面 (通常 为 32 页 ) 被 提前 提供 给 磁盘 控制 器 ， 但 是 页 面 不 必 像 顺 序 预 取 那 样 其 有 
连续 的 顺序 。 使 用 区 表 预 取 ， 通 常 伐 盘 控 制 器 执行 最 有 效 的 可 能 的 移动 序列 ， 它 可 以 确保 执 
行 连续 的 读 《 使 用 称 为 电梯 算法 的 方法 )。 这 样 的 HO 比 随机 IO 请 求 高 效 得 多 。 对 于 这 样 一 个 
列表 预 取 执 行 的 时 间 不 遵循 简单 的 通用 规则 ， 然 而 ， 在 图 9-8 中 ， 一 个 顺序 预 取 执行 所 需 的 
0.00125 秒 时 间 对 于 列表 了 预 取 而 言 通常 是 一 个 不 可 达到 的 最 优 值 。 列 表 蔬 芭比 随机 WO 更 为 高 效 
(我 们 认为 是 每 秘 80 次 WO )， 同 时 羡 比 需 序 预 取 LiO 低 效 一 些 {我们 认为 是 每 种 800 次 I1O )。 实 
际 的 速度 由 磁 稚 上 的 数据 页 面 的 间隔 来 确定 ， 但 是 ， 根 据 经 验 规则 ， 在 下 面 的 问题 中 ， 作 为 
经 验 规 则 我 们 假定 列表 预 取 以 每 秒 200 个 110 的 速度 来 进行 。 在 下 面 的 内 容 中 ,我们 将 大 量 的 
使 用 这 些 随机 1/O、 顺 序 预 取 WWO、 列 表 预 取 LO 近 似 速 度 值 ， 因 此 ， 图 9-10 以 表格 形式 列 出 刚 
才 提 到 的 经 验 和 规则,。 尽 管 这 些 是 相当 粗略 的 数据 ,但 是 它们 对 于 实践 中 的 查询 通常 可 以 给 出 
一 个 相当 好 的 估计 。 


同上 序 预 版 11D 刘表 天 取 IO 


300 页 /和 200 页 /和 





图 9-10 LO 速度 的 经 验 规则 


在 使 用 列表 预 取 计划 表 中 的 一 个 存 取 步 骤 将 用 PREFETCH=L 米 指明 ， 也 就 是 在 
PREFETCH 一 栏 中 的 字母 为 L， 类 似 于 当 顺 序 预 取 被 使 用 时 的 字母 S。 一 个 既 不 使 用 顺序 预 取 
也 不 使 用 列表 预 取 的 存 取 方 案 将 在 PREFETCH 列 上 有 一 个 空白 值 。 

(4) 有 关于 预 取 的 其 他 内 容 

在 下 面 的 章节 中 ， 我 们 将 举 出 许多 例子 来 强化 这 些 概念 。 伍 是 ， 我 们 在 9.6 节 讨论 DB2 中 
列表 预 本 的 前 提 条 件 以 前 ,我 们 不 考虑 列表 随 取 。 在 那 节 以 前 ， 我 们 总 是 认为 表 中 的 行 通过 
随机 TO 或 顺序 预 取 IJO 从 磁盘 读 人 内 存 。 

者 很 多 涉及 到 预 取 LO 的 特殊 情况 。 当 从 磁盘 中 读 人 的 页 面 数 小 于 32 时 ， 预 电 UO 依 然 是 可 
能 的 ; 实际 上 ， 预 取 在 只 读 人 4 个 页 面 时 也 可 以 执行 。 自 然 ， 因 为 我 们 减少 了 用 于 缓冲 阴道 时 
间 和 旋转 延迟 的 页 面 的 数目 ， 这 样 小 的 传输 率 会 影响 到 在 图 9-10 中 给 出 的 TO 速度 ， 但 是 在 接 
下 来 的 计算 中 , 我 们 通常 不 考虑 这 种 影响 。 然 而 ， 任 何 当 3 页 或 者 小 于 3 页 的 页 面 要 从 磁盘 上 
读 时 ， 即 便 在 顺序 预 取 或 列表 预 取 的 前 提 条 件 满足 的 情况 下 ， 你 应 当 考 卡 使 用 随机 TO 。 

很 明星， 顺序 预 取 和 列表 预 取 是 很 有 效 的 。 在 DB2 中 洋 于 顺序 预 取 的 一 个 重要 的 事情 是 
系统 具有 选择 是 用 随机 LO 读 单 个 页 面 或 者 用 一 个 预 取 1O 读 32 个 页 面 。 对 于 所 有 一 次 进行 8 个 
页 面 读 的 折衷 方 案 都 将 使 它 在 帮助 一 些 应 用 程序 的 同时 勾 使 另外 一 些 应 用 程序 处 于 不 利 地 位 。 
例如 ， 当 所 有 想 要 的 信息 已 经 被 放 单个 页 面 节 点 上 时 ， 在 一 棵 B 树 节点 周围 恋人 8 个 页 面 就 会 
得 不 到 任何 值 。 实 际 上 ， 这 样 一 种 浪费 内 存 钥 冲 区 空间 的 行为 使 得 每 一 个 人 都 处 于 不 利 地 位 ， 
内 存 缓冲 区 空间 应 当 用 诗 保 持 在 缓冲 区 中 有 用 的 信息 。 


9.3 DB2 中 的 简单 索引 存 取 


就 像 我 们 在 第 8 章 论 述 的 那样 ， 在 一 个 Select 语 名 中 被 引用 的 表 中 的 列 可 以 参与 索引 ， 对 
于 Seleet 语 名 的 一 个 查询 方案 有 时 可 以 利用 那些 索引 来 限定 被 选中 的 行 ， 这 样 可 以 使 得 但 询 更 
为 高 效 。 在 下 面 几 节 ， 我 们 考虑 基本 的 索引 存 取 步 又 的 能 力 。 一 开始 ,我 们 只 考虑 如 下 情 次 : 
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只 涉及 到 一 个 表 的 Select 语 名 ， 而 表 和 名 在 FROM 了 于 句 中 命名 ,在 WHERE 子 名 的 搜索 条 件 的 子 
查询 中 没有 新 的 表 和 名 ， 这 样 就 可 以 避免 连接 过 程 。 除 非 另 外 声明 ， 和 否则 我 们 把 注意 力 集 中 在 
DB2 的 查 侧 优化 如 上 ， 亲 时， 我 们 只 是 在 括号 中 指明 ORACLE 产品 的 变化 。 在 下 面 的 例 牛 中 ， 
表 以 分 类 的 名 宁 T1，T2，-… 来 命名 ， 这 些 表 中 的 列 以 C1，C2，C3，C4，… 来 命名 。 


例 9.3.1 ”匹配 索引 扫描 、 单 列 索 引 假定 在 表 T1 的 C1 列 存在 一 个 索引 C1X (在 DB2 中 总 
是 B 树 索引 )， 发 出 下 面 的 查询 : 

select * from Tl where Cl = 10: 

这 个 查询 在 DB2 中 通过 一 个 被 称 为 匹配 索引 扫描 的 存 取 步 坚 来 完成 。 在 执行 阶段 ， 列 C1 
上 的 B 树 索引 被 遍历 到 值 为 10 的 最 左边 索引 项 的 叶子 层 ! 回忆 这 样 的 练习 ， 它 是 利用 例 8.3.1 的 
二 分 查找 算法 的 变型 来 找 出 最 左边 的 项 )。 然 后 ， 被 那个 项 指向 的 源 于 表 T1 的 行 被 检索 到 答案 
集合 。 紧 接着 ， 连 续 的 项 从 索引 的 叶子 层 被 检索 到 ， 同 时 索引 值 依然 保持 10， 在 项 中 从 左边 
到 右边 传递 ， 从 一 个 时 节点 传 到 下 一 个 叶 节 点 ， 必 要 时 用 玫 叶 子 的 兄弟 指针 。 对 于 每 一 个 项 ， 
在 T1 中 被 指向 的 相应 的 行 被 检索 放 人 答案 集合 。 当 索引 值 第 -- 次 超过 10， 匹 配 索引 扫描 就 完 
成 了 。 尤 其 需要 注意 的 是 ， 在 了 B 树 上 所 历 到 叶子 层 ， 只 需要 一 次 。 在 这 次 扫描 中 检索 到 的 行 可 
能 被 以 列 C1 为 序 的 京 馈 索引 找 出 ， 也 可 能 不 能 ; 我 们 没有 假设 对 于 C1 是 否 有 聚 艇 索引 。 国 


匹配 索引 扫描 是 一 个 单 步骤 的 查询 方案 ， 同 表 空 间 NC ACCESS TAITCE 
扫描 共享 此 特征 : 当 步 枝 完 成 时 ， 已 经 回答 了 查询 。 在 
方案 表 中 ， 图 9-11 是 其 中 的 三 列 ， 这 是 一 个 匹配 索引 扫 crx 1 | 
描 ， 就 像 在 例 9.3.1 中 看 到 的 那样 ，ACCESSTYPE=I{ 这 图 9-11 例 9.3.1 的 方案 表 
代表 一 个 索引 扫描 )， ACCESSNAME=CIX (被 扫描 的 
索引 的 和 名字 )，MATCHCOLS=1。MATCHCOLS 给 出 在 索引 中 匹配 列 的 数目 ， 对 于 一 个 在 单 
列 上 的 索引 的 一 次 索引 扫描 ， 这 个 值 至 多 为 1。 

现在 考虑 下 面 的 索引 | : 


[9.3.1] select * from T1 
Where Cl = 10 and t2? between 100 and 200 and C3 Tike ‘A%': 
回 展 一 下 ， 在 3.9 节 的 图 3-19 中 列 出 的 由 许多 逻辑 谓词 组 成 的 WHERE 子 句 的 搜索 条 件 ， 它 
们 由 在 图 3-20 中 定义 的 逻辑 运算 符 ， 如 AND、OR 和 NOT 来 连接 。 上 述 [9.3.1] 中 的 select 语 句 包 
含 三 个 由 逻辑 符 AND 连 接 的 谓词 (1) 涉 及 到 列 C1 的 比较 谓词 (这 是 一 种 特殊 的 比较 谓词 ， 被 
称 为 等 价 匹配 谓词 )，(2) 涉 及 到 列 C2 的 BETWEEN 谓 词 ，(3) 涉 及 到 列 C3 的 LIKE 谓 词 。 在 这 些 
情况 的 每 一 种 ， 在 相关 列 上 的 索引 在 DB2 查 询 方案 中 都 能 够 有 效 地 用 来 限制 检索 到 的 行 。 这 
些 确 词 在 DB2 中 被 称 为 是 可 索引 的 。 然 而 ,不 是 所 有 的 谓词 都 有 是 可 索引 的 ， 这 意味 着 尽管 用 
一 个 索引 限制 检索 到 的 行 是 可 能 的 ， 但 是 索引 将 不 能 够 被 很 有 效 地 使 用 。 例 如 ， 稍 光 Cl<10 
就 是 不 可 索引 的 ， 尽 管 它 可 以 在 C1X 的 索引 上 用 索引 扫描 ， 但 是 查询 
select * from Tl where Cl © 10: 
更 可 能 使 用 一 个 表 空 间 扫 描 ， 在 低 效 率 运行 时 它 总 可 以 得 到 。 在 本 章 的 后 面 ， 我 们 将 给 
”出 关于 可 索引 和 不 可 索引 谓词 的 一 张 详细 列表 。 现 在 ,我们 想 要 研究 [9.3.1] 的 Select 语 句 的 
WHERE 子 句 中 的 多 重 谓词 也 许 被 同时 使 用 来 限定 检索 到 的 行 。 


例 9.3.2 ”匹配 索引 扫描 、 单 列 索 引 、 额 外 确认 的 谓词 ”就 像 前 面 一 样 ， 假 定 在 表 TI 的 列 
Cl 上 存在 一 个 索引 C1X， 但 是 这 次 [9.3.1] 的 查询 是 这 样 提出 的 : 


i 
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Select * from Tl 
where Cl = 10 and ta between 100 and 200 and C3 Tike ‘A%": 


我 们 根 定 在 列 C2 和 CG3 上 没有 索引 。 就 像 在 前 面 所 做 的 那样 ， 这 个 查询 在 PB2 中 是 通过 一 
次 匹配 索引 打 描 存 取 步 又 来 完成 的 。 在 列 C1 上 的 B 树 索引 被 遍历 到 具有 值 为 10 的 最 左边 索引 
项 的 叶子 层 。 值 为 10 的 叶子 晨 的 项 被 从 左 到 右 遍 历 。 然 后 ， 系 统 存 取 这 些 被 项 指 同 的 来 自 于 
宕 1 的 连续 的 行 ， 在 行 上 执行 测试 以 确认 其 他 的 两 个 谓词 ; C2 between 100 and 200 和 
C3 1ike'A%m%'。 满足 这 些 测试 的 行 被 检索 入 答案 集合 。 国 


例 9.3.1 和 例 9.3.2 中 介绍 的 匹配 索引 扫描 步 又 被 定义 为 : 它 是 这 样 一 个 步骤 ， 其 中 单个 索 
引 被 用 来 检索 所 有 的 来 自 于 满足 WHERE 子 名 中 一 些 谓词 (或 请 词 集合 ) 条 件 的 表 中 的 行 。 在 
一 个 单列 上 有 索引 的 情况 下 ， 匹 配 索引 扫描 通常 代表 一 个 列 值 的 连续 范围 ， 相 应 于 一 个 谓词 ， 
比如 C1L=10《{ 在 列 CI 上 的 索引 CIX )，C2 between 100 and 200 (在 C2 上 的 索 3|C2X) 
或 者 C3 like 'A%' (在 C3 上 索引 C3X)。 列 值 的 一 个 不 连续 集合 也 可 以 用 匹配 索引 扫描 的 一 种 
特殊 情况 来 检索 ， 被 称 为 IN-LIST 索 引 担 描 ， 用 在 如 c4 in (3,2,3} 这 样 的 谓词 上 ( 列 C4 上 
有 一 个 C4X 的 索引 )。 通 过 在 一 次 匹配 索引 扫描 中 的 单个 索引 一 次 满足 儿 个 请 词 也 是 可 能 的 。 
考虑 索引 C123X， 用 下 面 的 Create Index 语 句 来 建立 : 


treate index Cl23% on Tl Col, Ce, C3 . ， 


全 9.3.2 的 Select 语 名 中 ， 人 和 仅仅 可 利用 C1 党 引 ， 我 们 注意 到 两 个 后 面 的 硝 词 并 不 减少 从 TI 
存 取 的 行 的 数目 。 我 们 仅仅 用 第 一 个 谓词 CL-10 来 限制 行 的 数目 ， 然 后 从 表 中 丰 取 等 一 行 来 
满足 其 他 的 谓词 。 但 是 如 果 可 以 得 到 C123X 索 引 ， 那 么 我 们 就 可 以 通过 依靠 这 个 单个 索引 一 
次 限制 所 有 三 个 谓词 (c1=10, C2 between 100 and 200, C3 like 'A$%' ) 作为 一 
个 类 比 ， 我 们 在 图 书馆 目录 中 寻找 名 为 James {C1=10 }， 姓 以 字母 H 到 KK 开头 (C2 petween 
100 ana 200)， 题 目 以 字母 A 开 头 (C3 1ike'as' ) 显而易见 ， 我 们 可 以 通过 单独 检查 
卡片 很 有 效 地 来 限制 检索 到 的 书 的 数量 。 

在 第 二 种 类 型 的 情况 下 ， 分 离 的 索引 存在 于 下 面 讨论 的 每 一 列 上 。 这 样 ， 我 们 也 许 在 C1 
上 有 党 引 CIX、 在 C2 上 有 索引 C2X、 在 C3 上 有 索引 C3X。 我 们 利用 三 种 不 同 的 索引 来 回 管 例 
9.3.2 的 查询 ， 但 是 这 种 方法 也 许 不 是 显而易见 的 。 通 过 类 比 ， 查 询 的 过 程 是 这 样 的 它 先 从 
每 一 个 满足 一 个 给 定 亩 词 的 相关 目录 中 抽取 出 一 列 且 录 卡 片 ， 再 通过 调用 序数 (RID ) 对 每 一 
列 卡 片 依 序 排序 ， 然 后 对 三 列 卡片 进行 合并 一 交 操 作 ， 最 后 ， 我 们 可 以 得 到 满足 三 个 谓词 条 
件 的 书 。 这 个 多 步 双方 法 被 称 为 多 索引 存 取 ;在 我 们 叙述 一 些 更 为 基本 的 关于 索引 存 取 的 概念 
之 后 ， 我 们 会 更 详细 地 讨论 它 。 

1. 相等 的 唯一 匹配 索引 存 取 

经 验 表 上 明 :， 当 第 一 次 介绍 用 索引 来 检索 时 ,许多 读者 倾向 于 使 用 有 唯一 值 的 列 。 实 际 上 ， 
这 梢 对 来 说 并 不 是 很 有 趣 的 情况 ， 我 们 还 是 给 出 如 下 的 例 于 。 

例 9.3.3 ”索引 扫描 步骤 、 了 唯一 瑟 配 考 虚 例 9.2.1 介 绍 的 表 employees， 它 在 列 eid 上 有 
一 个 唯一 的 索引 edix。 我 们 给 出 下 面 一 个 SQL 查 鹿 : 

select ename from employees Where eid 一 “12901 

我 们 根 定 有 一 个 PCTFEE=30 的 DB2 的 党 引 (参见 图 8-15 DB2 UDB 的 Create Index， 对 于 
DB2 也 一 样 )， 对 于 索引 项 可 得 到 的 索引 的 每 一 真 面 上 的 2800 个 字 节 。 假 定 列 eiq 需 要 6 字 节 。 
因为 我 们 知道 RID 需 要 4 字 节 ， 我 们 可 以 假定 每 个 项 为 10 字 节 。 这 样 在 每 一 个 索引 页 面 上 有 
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2800710 = 280 个 项 ， 有 200 000 行 时 ， 在 叶子 层 我 们 需要 CEIL(GC200 000/280)=715 页 ， 在 目录 层 
上 需要 CEIL(7157280)=3 页 ， 绸 往 上 ， 我 们 只 需要 一 个 根 页 面 。 存 取 带 有 一 个 给 定 eia 值 的 哗 
一 的 行 需 要 存 取 二 层 B 树 的 和 节点， 然后， 存 取 14 286 数 据 页 和 面 中 的 一 页 并 从 指定 行 上 检索 
ename 值 。 有 所 | 以， 看 上 去 Select 语 句 的 WO 代价 为 4R。 但 是 ， 考 虚 到 我 们 把 常用 的 磁 盘 页 面 放 
在 内 存 缓冲 区 来 减少 实际 磁盘 HO 的 数目 。 由 查询 优化 器 计算 的 COST,o(PLAN) 数 值 以 实际 的 
LO 代价 来 评 居 .已 经 在 内 存 中 的 页 面 仅仅 增加 了 少量 的 CPU 人 代价 。 就 像 我 们 将 要 在 第 10 章 洋 
细 介 绍 的 那样 【参见 例 10.10.2 )， 购 买 足 够 的 内 存 来 保存 在 几 分 钟 内 被 肖 次 存 取 的 所 有 的 磁 稚 
页 面 (我 们 假定 是 120 秘 ， 这 个 是 在 IBM DB2 上 指定 的 )， 这 样 的 选择 在 经 济 上 是 正确 的 。 这 
束 是 我 们 说 要 保留 常用 页 面 的 缓冲 区 驻 留 的 会 久 。 

现在 ， 我 们 需要 关心 eiGx 上 的 B 树 索引 被 存 取 的 频 度 。 旭 果 每 秘 有 一 个 随机 的 eia 值 ， 
我 们 应 当期 望 找到 树 的 根 节 点 和 所 有 下 一 个 日 录 层 中 已 经 在 内 存 缓冲 的 三 个 节点 。 另 外 一 个 
方面 ， 存 取 叶 节点 的 期 望 时 间 是 715 秒 ， 多 于 120 秒 的 国 值 ， 因 此 我 们 不 会 期 望 在 缓冲 中 找到 B 
树 的 叶 节 上 点。 显而易见 ， 我 们 也 不 会 期 望 在 页 面 缓冲 驻 留 区 找到 14 286 数 据 页 面 。 这 样 ， 在 
合理 的 缓冲 假设 下 ， 对 于 这 个 查询 方案 的 正确 的 MO 代价 应 当 是 2R， 它 代表 该 磁盘 的 B 树 的 叶 
节点 和 数据 页 面 的 LO 人 代价。 注意， 所 有 刚才 的 分 析 都 是 基于 - :个 完美 的 假设 一 一 已 经 购买 了 
起 够 数 基 的 内 存 以 及 缓冲 区 模式 可 把 所 有 HB 树 昌 录 节 点 放 人 内 存 缓冲 区 中 . 

对 应 十 这 个 唯一 比 配 索引 扫描 的 方案 表 的 和 是: ACCESSTYPE=1 (让 含 一 个 索引 扫 找 )， 
ACCESSNAME=eidx (被 扫描 的 索引 的 名 字 )，MATCHCOLS=1。 这 个 方案 没有 提 到 应 当 有 
一 个 唯一 的 匹配 ; 通过 指明 列 sid 被 定义 为 唯一 的 ， 我 们 就 可 以 预测 到 这 样 一 个 性 质 ， 国 

聚 复 与 非 果 艇 索引 

回忆 在 8.4 节 ， 一 个 聚 入 索引 通常 有 一 个 B 树 索引 目录 结构 ， 它 们 在 磁盘 的 一 个 区 域 ，5| 
用 以 主键 顺 序 存储 在 连续 或 近似 连续 的 伐 规 页 面 上 的 行 ， 它 们 也 可 能 在 磁盘 的 不 同 区 域 . 

在 下 面 的 例子 中 ， 我 们 引信 一 个 命名 为 prospects 的 表 。 表 prospectg 建 模 十 由 执行 
定向 邮件 应 用 服务 的 组 织 所 拥有 的 表 上 | 上 。 表 prospects 有 50 000 000 行 ， 它 们 对 应 于 在 美国 
有 可 能 成 为 新 产品 的 潜在 顾客 的 市 民 。 候 选 人 的 信息 通常 来 自 于 担保 问 眷 .( 假定 填写 担保 问 
卷 的 人 人 期望 他 们 的 统计 数据 可 以 保留 在 记录 上 用 于 将 来 可 能 的 邮件 }。 表 prospects 的 行 在 
DB2 中 通过 一 个 索引 aaarx 被 聚 秘 ， 它 代表 候选 人 的 地 址 ; 

creaate index gdrg on prospects (zipcode, city, straddr) . . - 


cluster , ， .; 

阿 顾 一 下 ， 一 个 邮编 号 码 确 定 了 一 个 州 【 因 为 邮编 号 码 不 会 跨越 州 界 )， 并 生 通 常 对 应 
于 一 个 大 威 市 的 一 个 区 。 许 多 直 接 的 邮件 ， 比 如 区 域 性 商店 的 销售 通知 ， 包 含有 一 些 邮 编 代 
码 区 域 的 小 的 地 理 上 的 区 域 ， 这 样 ， 我 们 就 可 以 明白 通过 addrx 的 聚集 可 以 得 到 极为 高 黎 的 
查 阐 。 

我 们 假设 ， 表 prospects 和 所 有 的 索引 PCTEREE=0， 因 为 我 们 并 不 期 望 在 表 
prospects 的 生命 期 中 有 什 何 插 人 、 甚 至 更 新 的 操作 。 我 们 很 少 会 把 新 的 家 庭 加 到 表 
Prospects 中 去 。 典 型 的 ， 我 们 会 每 周 重新 装载 表 来 确保 最 佳 的 查询 效率 ， 这 时 新 的 候选 者 
会 被 加 人 。 假 设 表 prosPpects 的 每 一 行 包含 有 400 个 字 节 ， 我 们 可 以 在 每 个 4KB 的 页 面 上 放 
10 行 ， 那 么 一 个 5 于 万 行 的 表 需 时 5 百 万 个 由 面 。 

在 adarx 索 9|B 树 结构 的 叶子 层 ， 我 们 假设 列 zipcode 可 以 用 4 个 字 节 的 整 型 数 来 表示 ， 
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city 需 要 123 个 守节，straddr 为 20 个 字 节 ， 当 然 对 于 每 一 个 项 的 RIDP 需 要 4 个 字 节 .这 样 在 
addrx 索 引 上 的 一 个 项 需要 40 个 字 节 。( 我 们 简单 地 假设 没有 重复 的 索引 值 ， 也 就 是 说 ,没有 
两 个 或 多 个 候选 人 有 相同 的 地 址 。 这 样 ， 我 们 就 可 以 于 免考 虑 在 图 8-17 中 涉及 到 的 DB27DB2 
UDB 中 的 索引 压缩 类 型 。) 在 100 狗 满 的 4KB 页 面 中 ， 我 们 可 以 就 人 100 个 天 小 为 40 字 节 的 项 。 
对 于 总 共 5 干 万 的 项 ,这 意味 着 在 树 的 叶子 层 有 50 万 节点 负面。 目录 层 含有 5 于 个 节点 ， 在 这 
居 之 上 含有 50 个 节点 页 面 ， 再 往 上 就 是 根 的 页 面 。 这 是 一 个 4 层 的 B 树 。 

表 prospects 也 有 大 量 的 非 聚 秘 索 3|。 考 虚 一 种 可 能 的 索引 ， 比 如 在 属性 hobby 上, 它 
是 由 候选 人 人 在 问卷 上 提供 的 个 人 主要 的 爱好 。 

create index hobbyx on prospects (hobby?}. 

假设 在 候选 人 填写 的 表格 的 这 一 栏 上 有 100 种 不 同 的 爱好 ( 例如， 扑克 牌 、 国 际 每 棋 、 收 
集 货币 -……… )。 我 们 说 hobby 列 的 基数 ， 也 就 是 具有 不 同属 性 值 的 数目 ， 共 100: 

CARDIhobby) = 100 

这 是 在 计算 -个 查 闸 方案 的 WO 代价 时 由 DB2 使 用 的 一 种 统计 ， 它 也 给 了 我 们 一 个 在 
hobhbhyx 索 引 中 出 现 的 索引 压缩 数目 的 思想 。 同 样 的 ， 我 们 可 以 假设 在 aadarx 索 引 中 ， 它 有 
100 000 个 不 同 的 值 ， 从 00000 到 99999。( 这 实际 上 是 过 多 估计 了 ， 只 是 为 了 简单 ) 基 机 上 爱 
好 的 种 类 少 意 味 着 我 们 可 以 假设 nopby 列 的 长 度 同 叶子 层 索 引 项 是 无 关 的 ， 因 为 从 图 8-17 的 
DB2 的 尝 引 压缩 我 们 明白 索引 关键 字 对 于 几 百 个 RID 只 出 现 一 次 。 这 样 ， 叶 子 层 的 项 可 以 有 4 
字 节 长 度 ， 每 抽 面 有 1000 项 。 央 为 对 于 每 一 种 爱好 我 们 大 约 有 500 000 个 候选 者 与 其 对 应 ， 
DB2 的 索引 压 织 可 以 用 于 它 的 最 有 效 的 形式 ， 缓 冲 到 每 一 个 主键 值 有 255 个 RID。 在 叶子 层 有 5 
干 万 个 项 ， 且 在 一 个 页 面 上 有 1000 个 项 ， 我 们 就 有 50 000 时 子 页 面 。 在 紧 接 着 的 上 一 层 ， 案 引 
关键 字 分 隔 符 随 着 每 一 个 项 而 出 现 【 没有 压 纲 )。 如 果 我 们 假设 12 字 节 的 项 ， 那么 -页 有 333 个 
项 ， 这 样 我 们 有 50 000/1333=151 个 节点 。 再 往 上 一 层 就 是 根 。 这 些 计算 归纳 在 图 9-12 中 。 我 们 


现在 看 更 多 的 演 东 例子 。 


500 000 叶子 页 而 50 000 叶 子 责 面 
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图 9-12 表 prospects 的 - - 些 统计 和 信息 






例 9.3.4 ”匹配 索引 扫 措 步骤 、 非 售 针 的 匹配 考虑 下 而 的 SQL 查询 : 

select name, straddr From prospects where hobby 一 “chess' 

为 了 回答 这 样 一 个 查询 ， 查 询 优 化 器 在 索引 hobbyx 上 者 由 一 个 索引 扫描 步骤 。 这 个 可 以 
比 作 例 9.3.1 的 匹配 索引 扫描 步骤 ， 只 是 这 次 我 们 多 了 做 O 估 算 。 首 先 ，hobbyx 的 B 树 的 根 
节点 被 污 出 来 ， 紧 接着 是 沿 着 正确 路 径 到 下 一 个 节点 .一 直到 相应 于 带 有 和 值 为 "chess 的 
hobbyx 项 的 最 左边 的 叶 节 点 被 读 出 为 止 。 下 一 步 就 是 从 叶子 层 检索 连 绪 的 项 ， 一 直 思 到 共有 
hobbyx 的 值 为 'chess' 为 止 。 就 像 在 先前 指明 的 那样 ,对 于 hobbyx 只 有 100 个 不 同 的 值 。 如 采 
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我 们 假设 每 一 个 值 都 是 平均 分 布 的 ， 那么 对 应 于 值 为 'chess' 的 项 有 500 000 个 。 遍 历 每 个 叶 节 
点 带 有 1000 个 项 的 500 000 个 项 需要 500 次 叶子 页 面 的 VO 人 代价， 这些 WO 可 以 用 硕 序 预 取 LiO 来 
执行 。 现 在 ， 对 于 这 500 000 个 chess' 索 引 项 的 每 一 个 ， 我 们 必须 执行 一 个 随机 页 面 FO 来 存 取 
表 Prospects 的 合适 的 行 ， 并 且 返 回 name 和 straaadr 值 。 既 然 有 了 这 5 000 000 数 据 页 面 和 
500 000 行 ， 我 们 期 望 每 一 行 在 分 离 的 页 面 上 【这 实际 是 “N 文 飞 钉 在 M 个 空位 中 ”问题 的 一 
个 例子 ， 这 在 8.6 节 中 已 讨论 过 ， 将 作为 本 章 最 后 的 习题 的 一 个 主题 )。 在 人 性 何 情 况 下 ， 我 们 
都 没有 理由 认为 检索 到 的 行 在 数据 页 面 上 是 彼此 相 邻 的 ， 因 为 hobbyx 是 - -个 非 队 入 索引。 这 
样 每 一 个 行 检 索 珊 要 它 自 己 的 随机 WO， 并 且 执 行 这 个 咨询 需要 的 WO 的 总 数 是 : 对 于 索引 目录 
节点 2R， 索 引 叶 节点 500S8， 对 于 数据 页 面 是 500 000R。 

用 顺序 预 取 以 每 秒 800 页 的 速度 读 500 页 的 执行 时 间 是 500/800 = 0.625 秒 ; 用 随机 LO 读 
500 000 页 以 每 秘 80 次 LO 的 速度 的 执行 时 间 是 500 0007/80=6250 秒 ， 或 朝 说 略 小 于 2 小 时 。 显 
而 易 见 ， 在 hobbyx 的 B 树 上 往 下 找 的 11O, 其 至 于 在 叶子 层 遍历 项 的 WO 与 数据 页 面 的 WO 机 比 
都 是 无 关 紧 要 的 ， 加 

在 涉及 到 LO 执行 时 间 的 习题 中 ， 通 常 你 应 当 假 设 索引 目录 页 而 是 缓冲 区 驻 留 的 ， 而 索引 
叶子 页 面 不 是 ,除非 是 特别 指明 的 。 当 这 些 数 自 小 于 总 和 的 5 名 时 ， 你 就 可 以 在 答案 中 和 扰 略 索 
引 WO。 然 而， 你 应 当 很 小 心地 包括 索引 LO 计算 以 及 说 明 为 什么 你 认为 它们 是 不 重要 的 。 

如 果 例 9.3.4 的 查询 是 以 一 个 空间 表 和 扫描 来 执行 的 ， 我 们 可 以 看 到 用 顺序 巩 取 VO 检索 5 000 000 
页 ， 这 需要 5 000 000/800=6250 种 一 一 几乎 同 索引 扫描 基 相 同 的 时 间 。 这 是 -个 令 人 人 相当 惊奇 的 结 
果 ， 这 就 体现 了 在 比较 查询 方案 的 代价 时 -个 查询 优化 器 的 价值 。 基 本 上 ， 在 相同 的 时间 内 ， 用 
需 序 预 取 11O 与 随机 WO 相 比 大 约 可 以 读 十 倍 的 数据 页 面 。 因 为 这 个 例子 中 用 非 队 徐 索 引 拉 描 ， 它 
读 出 5 000 000 页 来 检索 相同 数目 的 带 有 一 个 hobby 索 引 的 prospects， 而 使 用 预 取 WO 数据 扫描 ， 
它 也 读 出 $ 000 000 页 ， 两 种 方法 在 执行 时 间 上 和 LO 磁盘 臂 上 的 费用 近似 相同 。 如 果 对 于 我 们 的 表 
prospects 有 更 多 的 爱好 ， 那 么 每 一 个 索引 值 会 对 应 更 少 的 数 日 ， 上 应 当 使 用 非 孙 入 索引 扫描 ， 然 
而 ， 对 于 更 少 的 爱好 使 用 数据 扫描 也 许 更 为 合适 。 

在 例 9.3.4 中 ， 我 们 用 CARDInobbpy)=100 这 样 的 事实 来 推断 谓词 hobbyr= 'chess :检索 到 
表 prospects 行 的 大约 11100。 这 个 分 数 就 是 谓词 的 讨 滤 因 子 ; 太 下 面 的 内 容 中 ， 我 们 将 经 
常 提 及 这 个 概念 。 

例 9.3.5 匹配 索引 扫描 步骤 ， 素 簇 匹配 考虑 下 而 的 3QL 查 询 ; 


select name, straddr from prospects 
here zipcode between Q2159 and 03158:; 


回顾 一 下 我 们 的 很 设 ， 有 100 000 个 不 同 的 zibpcoae 列 值 组 成 aaaerx 索 引 的 第 一 个 部 分 ， 
数据 行 在 adqrx 索 引 上 被 聚 簇 。 这 里 的 索引 的 描 步 又 通过 读 到 与 adadrx 对 应 的 B 树 的 最 左边 的 
具有 zipcoeae 值 为 02159 的 项 来 执行 它 的 搜索 ( 组 台 的 关键 词 值 的 其 他 值 没 有 被 具体 化 )， 然 后 
从 左 到 右 检 查 项 直到 竹 范围 以 外 的 第 一 个 zipcode 值 被 搜索 到 为 止 。 我 们 看 到 当 最 后 一 个 例子 
的 hobbyx 被 处 理 时 ， 几 乎 有 相同 数目 的 叶子 屋 索 引 项 被 处 理 。hopby='chess, 的 过 滤 因 子 
是 11100,， 但 是 这 里 我 们 正 检索 带 有 100 000 个 不 同 值 的 zipcode 索 引 中 的 1000 个 值 。 
zipcode=02159 的 过 滤 因 子 是 i100 000， 具 有 1000 个 值 的 范围 谓词 的 因子 是 10007100 000 
=11100。 如 果 以 每 个 项 有 40 个 字 节 ， 每 页 有 100 个 项 计算 ， 那么 被 污 入 的 带 有 500 000 个 项 的 
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adadrx 的 叶子 层 的 页 面 的 数 日 基 5 000; 因为 可 以 用 顺序 预 取 ， 这 意味 者 5000S 的 TO 代价 . 《在 
这 之 上 的 一 -个 简单 的 检查 是 在 addrx 的 叶子 层 的 页 面 的 数 日 ， 像 在 图 9-12 中 那样 ， 是 500 000， 
我 们 将 处 理 这 些 页 面 的 1L00 小 

于 在 我 们 将 从 表 prospects 中 检索 相同 数目 的 行 ， 或 者 说 是 500 000 行 ， 就 像 我 们 在 例 
9.3.4 中 所 做 的 那样 、 然 而 ， 国 为 在 brospecte 中 的 行 是 以 zipcoae 事 簇 的 ， 也 就 是 说 ， 它 
们 不 是 以 hoppbyx 际 艇 的 ， 在 zipcode 中 连续 检索 范围 的 500 000 行 在 表 数 据 页 面 中 被 放 在 一 
起 ,一 个 页 面 中 有 10 行 。 因此， 我 们 可 以 假设 我 们 仅 仪 需要 检索 表 中 的 50 000 和 抽 ， 我 们 用 顺 
序 换取 WO 来 完成 这 个 任务 ， 所 以 VO 代价 是 50 0008。( 注意 ， 我 们 要 羽 5 0008 来 检索 - -个 相同 
数 日 的 addrx 项 ， 长 度 是 40 字 节 ， 这 些 行 在 长 度 上 是 400 字 节 ， 因 此 这 就 是 对 我 们 工作 的 -个 
检查 }。 对 应 5000S+50 000S 的 总 执行 时 间 是 55 0007800=66.8 秒 ， 略 大 于 1 上 分钟 ， 请 与 前 … 个 例 
于 的 几乎 2 小 时 相 比 ， 这 束 是 用 代 簇 优点 的 一 个 最 显著 的 例子 。 图 

来 看 例 9.3.5， 我 们 注意 到 查询 优化 器 在 检索 被 索引 的 行 之 前 ， 选 择 检查 在 范围 中 的 每 一 
个 索引 项 ， 即 使 这 些 行 已 经 被 索引 伯 聚 签 。 一 旦 行 范围 内 的 左边 末端 被 定位 后， 忽 赂 索引 项 
似乎 就 可 以 节省 WHO 时 同 ， 所 以 只 需 看 选择 范围 的 数据 页 面 序 襄 的 行 。 然 而 ， 在 DB2 中 不 是 这 
样 做 的 。 所 以 项 总 是 被 检查 的 - -个 重要 原因 是 许多 新 行 的 插入 填 满 了 数据 页 面 后 聚 徐 的 性 质 
破坏 了 。 当 这 种 情况 发 生 后 。 以 后 插入 的 在 范围 内 的 值 就 被 完全 放 党 在 局 部 数据 页 面 序列 之 
外 ， 在 值 的 范围 中 检索 到 这 样 的 行 的 唯一 方 鞭 便 是 检查 索引 项 。 尽 管 我 们 在 表 被 重新 组 织 以 
前 不 向 表 prospects 插 入 新 的 行 ， 亿 是 DB2 不 知道 这 些 ， 所 以 在 检索 行 以 前 总 是 要 检查 索 
引 项 。 

2, 公使 用 索引 的 检索 

例 9.3.5 的 另外 一 个 有 趣 的 发 现 是 在 要 求 的 范围 内 害 检 索 的 索引 项 增加 了 50008 的 MO 代价 ， 
被 检索 的 数据 行 增加 了 50 000S 的 IO 代价 。 因 为 涉及 的 数据 项 在 长 度 上 是 40 字 节 ， 数 据 行 是 
400 字 节 ，LO 代 价 入 以 10 是 自然 的 。 这 个 发 现 以 及 我 们 看 到 的 其 他 一 些 例子 使 得 我 们 以 下 列 
特性 来 总 结 出 在 数据 行 上 的 索引 项 的 检索 优点 : 

1) 索引 具有 这 允许 我 们 有 效 地 检索 值 范围 的 是 录 结 构 。 

2) 索引 项 总 是 按照 值 在 连续 的 磁盘 和 页 面 上 按 序 放 置 ， 这 样 系统 就 可 以 用 顺序 预 取 1JMO 来 获 
得 较 低 的 检索 代价 。 

3) 索引 项 比 数据 行 短 ， 因 此 需要 相应 比例 的 更 少 的 时 间 。 

我 们 可 以 有 意 在 委 簇 的 行 上 放 管 一 个 日 录 竺 构 ， 其 中 在 B 树 的 叶子 层 行 取代 项 ， 这 样 在 到 
馈 的 行 结构 上 可 得 到 性 质 1 和 性 质 2。 当 然 ， 我 们 可 以 仅仅 通过 值 的 一 个 集合 来 聚 簇 行 ， 同 时 
我 们 可 以 对 于 不 同 的 索引 值 创建 大 量 的 索引 我们 可 以 在 下 面 的 一 个 例子 中 看 到 性 质 3 的 一 个 
独特 的 优点 。 


例 9.3.6 ” 串 接 索引 ， 仅 使 用 索引 的 扫描 ”再 一 次 考虑 例 9.3.5 的 SQL Select 语 名; 


select name, straddr from prospects 
where zipcode betweern 2159 and O3158; 


回忆 一 下 ，addrx 索 引 被 用 于 例 9.3.5 以 存 取 表 prospects 中 指定 zipcode 范 围 的 行 ， 
aadaqrx 用 如 下 诸 何 创建 : 
create index addrx on prospects tzfpcode, city, straddr} . 


tluster . . . : 
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一 -一 = 一 


但 是 ， 现 在 让 我 们 假设 一 一 仅 对 于 现在 这 个 例子 ~ 一 一 个 蔡 代 的 索引 naddrx 已 经 用 如 下 
语句 创建 : 
Create Tndex naddrx on proaspects {zipcode. city. straddr, name 
.Cluster ， 


正 像 我 们 将 看 到 的 ， 索 引 naddrx 是 表 Prospects 的 一 个 聚 篮 索 引 这 一 事实 对 于 这 个 例 
子 不 是 很 重要 ， 因 为 加 管 这 个 例子 一 开始 的 Select 语 句 只 要 通过 引用 naddrx 中 的 值 的 分 其 而 
无 须 对 表 prospects 的 任何 引用 。nadarx 索 引 的 串 接 键 值 具有 概念 形式 ; 

naddrx Key value: zipeodeval .cityval.straddrval nameval 

因此 每 一 单个 分 基 的 值 可 以 在 指定 范 闭 内 检索 到 的 索引 项 被 读 出 ， 它 被 检索 到 select 隔 
句 的 选择 列表 中 。 为 了 回答 我 们 开始 谈 到 的 Select 语 句 ， 在 ziPcoae 范 围 中 的 naddqrx 索 引 项 
被 存 取 ， 就 像 它 们 在 例 9.3.5 中 那样 ;但 是 代替 由 项 RIP 指 向 的 被 引用 的 相关 行 ， 在 Seleet 井 可 
的 选择 列表 中 的 name 利 straddr 的 值 从 索引 naddr 键 值 的 第 4 和 第 3 个 介 量 被 检索 。 这 种 类 
型 的 索引 扫 棋 就 是 仅 使 用 索引 的 扫描 。 

这 种 检索 的 VO 代价 是 多 少 ? 殷 设 在 naddrx 上 的 索引 项 是 60 字 节 ， 比 40 字 市 addrx 项 长 
50% ， 这 是 因为 额外 的 name 列 。 在 例 9.3.5 中 ，aqdrx 索 引 项 检索 的 代价 是 5000S ， 因 此 我 们 
期 望 对 于 naddrx 是 7500S。 因 为 在 仅 使 用 索引 检索 中 没有 其 季 1WO 人 代价， 我 们 期 望 查 向 时 间 古 
7500/800 = 9.4 秒 。 这 可 以 与 例 9.3.5 中 的 相同 查 痢 的 66.8 秒 进行 比较 。 国 


仅 使 用 索引 的 扫描 发 生 在 下 面 的 情况 下 ， 它 相应 于 一 个 Select 语 句 ， 南 且 当 在 选择 列表 中 
被 检索 的 元 素 可 以 从 使 用 的 索引 项 被 产生 ， 并 且 不 需要 回潮 则 数据 行 。 尤 其 应 该 注意 ， 只 此 
一 个 索引 扫描 可 以 完全 解决 WHERE 子 句 中 的 搜索 条 件 ， 那么 来 自 于 单个 表 的 任何 Setect 语 句 
可 以 用 公使 用 索引 的 检索 被 执行 ， 其 中 count (* ) 是 选择 列表 的 单一 元 素 ; 检索 到 的 项 仅仅 
需要 被 和 加 以 提供 解答 。 当 在 方案 表 中 用 EXPLAIN 来 产生 查询 方案 步骤 时 ， 一 个 仅 使 用 索引 
的 扫描 步骤 由 方案 的 列 ACCESSTYPE=I 来 注 明 ， 同 时 通过 一 个 我 们 第 一 次 提 到 的 新 列 
INDEXONLY=Y 来 注 明 。 在 前 面 的 例子 中 ， 我 们 有 INDEXONLY=N。 

例 9.3.6 显 示 了 在 使 用 串 接 索引 中 允许 仅 使 用 索引 的 检索 的 一 全 有 价值 的 优点 【 基 至 比 非 
来 入 索引 检索 更 有 优势 }。 然 而 ， 创 建 一 个 串 接 索引 的 集合 来 预测 查询 第 要 的 索引 经 常 是 很 困 
难 的 。 便 如 ， 考 虑 例 9.3.6 的 查询 ， 如 果 我 们 希望 检索 一 些 其 他 的 prospects 属 性 ， 并 旦 把 它 
们 放 人 选择 列表 中 ， 这 样 会 发 生 什么 情况 呢 ? 

select name,. straddr, age from prospects 

Where zipcode between O2159 and 03159; 


这 样 ， 毕 接 索引 nadarx 对 于 回 管 一 个 仅 使 用 索引 扫描 的 查询 是 不 够 的 ， 毕 竟 它 对 于 读 人 
表 中 的 行 是 必须 的 ， 除 了 现在 被 使 用 的 naddrx 索 引 需 要 比 我们 一 开始 就 涉及 的 单个 addrx 索 
引 更 多 的 IO 以 外 。 如 果 我 们 在 一 个 简单 的 串 接 索引 中 预见 到 所 有 的 需求 ， 索 引 项 会 变 得 越 来 
越 长 ， 直 到 我 们 发 觉 比 直接 在 行 中 读 的 优点 还 少 为 止 { 至少 在 聚 簇 的 情况 下 )。 更 进一步 讲 ， 
创建 多 重 素 引 需要 有 一 些 耗 费 。 一 方面 ， 会 增加 磁盘 介质 约 费 用 ， 尽 管 通常 面 言 这 不 是 一 个 
很 重要 的 费用 。 另 外 一 方面 是 新 的 行 插入 到 站 中 ， 因 为 插入 需要 耗费 更 多 的 资源 来 更 新 索引 。 
即使 在 只 读数 据 库 中 ， 在 初始 化 的 装载 时 还 是 有 额外 的 花 销 ， 对 于 像 prospects 这 样 的 大 下 
这 是 一 个 不 容 忽 视 的 因素 。 你 仍然 应 当 清 楚 ， 有 很 多 只 读 表 的 例子 ， 例 如 prospects 表 ， 胡 
中 所 有 的 单独 列 都 有 一 个 相应 的 索引 。 
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9.4 过滤 因子 和 统计 


就 像 在 例 9.3.3 中 指出 的 邦 样 ， 闪 一 个 带 有 单个 值 的 列 上 进行 索引 检索 实际 上 并 不 是 一 件 
有 趣 的 事情 ， 事 实 上 ， 在 诸如 SQL 这 样 的 关系 查询 语言 中 介绍 的 一 个 极其 重要 的 而 在 早期 数 
据 库 模型 中 区 被 忽略 的 特性 是 它 的 基于 复合 ( 通常 是 AND ) 诗词 条 件 的 检索 信息 。 明 亚 地 ， 
如 果 :个 庶 如 Cl1=10 的 谓词 是 确定 表 中 的 一 行 ， 考 虑 诸如 C1=10 and C2 between 100 
angd 200 的 复合 诈 启 没有 意 头 。 如 果 第 一 个 谓词 确定 了 一 行 ， 第 -个 蛮 词 仅 公 排除 那 一 行 而 
且 返 回 室 值 。 在 下 上 的 内 容 中 ， 我 们 通常 考虑 单个 的 谓词 跟 制 ， 例如 CL=10， 导 致 惰 表 中 行 
集合 的 - -个 太 的 子 集 ， 同 时 第 二 个 谓词 C2 petween 100 ana 200 过 小 那个 集合 ， 把 对 于 
行 的 检索 缩小 到 一 个 很 小 的 数量 。 我 们 说 一 个 谓词 P 的 一 个 过 站 因子 FF(P) 就 是 从 谓词 限制 P 得 
到 的 行 同 专 的 总 行 数 的 比值 。 我 们 通常 通过 做 一 个 统计 上 的 假 痉 来 个 滤 请 词 的 过 滤 因 子 , 包 
括 单 个 列 值 的 均 义 分布 和 来 自 于 任何 两 个 不 相关 列 的 独立 连接 分 布 。 我 们 将 在 后 而 讨论 这 些 
假设 的 -一些 点 化 

例如 ， 我 们 说 不 同 的 zipeede 值 的 数目 被 认为 有 100 000 个 ， 用 CARD(zipcode)=100 000 
来 表示 。 假设 在 表 prospects 中 所 有 zipcode 的 值 被 表示 为 相等 【 均 色 分 布 假 设 )， 我 们 可 
以 佑 算 一 个 等 价 匹 配 谓 词 的 过 沽 因子 zipeoede=const ,如 下 : 

Frtizipcode=const} -l/l1c8d BDO0=0.00001 

相同 的 根 设 使 得 我 们 可 以 估算 例 9.3.5 的 BETWEEN 谓 词 的 过 让 因子 : 


FFiwivcode Between 02153 and 03338};} -1]0001171c69 S00)=1A120=0.0: 


类 伺 地 ， 列 hobby 的 基数 由 CARD(hobby)=100 给 出 ， 也 用 均匀 分 布 假设 ， 我 们 得 到 ， 


Fr iheoeoby_ 'chess'}=2A1o00-0.G1 
两 个 不 关联 列 的 值 的 联合 分 布 是 独立 的 ， 意 味 着 对 于 复合 AND 谓 阅 的 两 个 过 滤 因 子 相 
来 ， 即 : 


FF Ihobovw='mhesas dr sipcvode DelLweer 212159 and 02658)= i110 (orAICG NNl=0.00005 

-- 个 请 词 集合 ， 每 个 带 有 一 个 相对 没有 限制 的 过 沽 因子 ， 可 能 在 AND 联 合 中 有 很 重要 
的 效果 。 

例 9.4.1 ”过滤 因子 计算 ”考虑 一 个 可 能 在 警察 局 用 到 的 一 个 查询 ,已 追踪 -- 辆 涉及 到 一- 
起 严重 撞车 各 人 忻 的 车 ， 找 出 所 有 的 拥有 红色 的 1997 年 由 Olds 制 造 的 型 号 为 88 并 在 Ohio 注 册 的 
驾驶 员 : 


select * from autos where license = ‘Ohio’ and color = red’ 
and yaar = 1997 and make = ‘Dlds” ard model 一 “993 


在 相当 合理 的 假设 下 ， 我 们 期 望 这 个 子 句 的 谓词 将 对 其 有 4 千 万 行 的 表 autos 进 行 过 滤 ， 
最 后 ， 留 下 更 易于 管理 的 几 百 行 。 这 是 可 能 的 ， 所 有 汽车 的 1/50 在 Ohio 注 册 ，1/10 是 红色 的 ， 
118 是 1997 年 的 ，176 由 Olds 制 造 ，178 是 88 型 的 。 除 了 相关 的 Olds-88 对 ， 我 们 假设 这 些 属 性 都 
是 独立 的 。 例 如 ,驾驶 . - 辆 Olds88g 并 不 排斥 他 同时 头 红 色 的 车 。 我 们 把 每 一 个 谓 闭 的 过 滤 因 
子 都 乘 起 来 以 得 到 整个 在 WHERE 子 名 的 查询 条 件 中 的 过 滤 困 子 ， 

FFIiSearcn cond} TY750 TILALOITTE7BITL7STITL7S1I -LI7L92 O00 

通过 Seleet 语 铝 检索 到 的 行 的 数 日 近似 地 统计 为 (17192 000)(40 000 000)=208.33， 即 大 约 
为 208 行 。 一 旦 给 定 这 种 大 小 的 一 个 解 的 集合 ， 通过 同 车 主 谈话 和 检查 车 的 物理 损伤 标记 以 做 
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进一步 的 调查 都 是 合情合理 的 。 天 


过 滤 因 于 的 术语 来 自 于 DB2， 它 基 寸 它 的 查询 优化 器 对 十 从 RUNSTATS 实 用 程序 收集 的 
统计 信息 的 居 算 。 

1. DB2 统 计 

图 9-13 列 出 了 由 RUNSTATS 实 用 程序 收集 的 统计 信息 ， 它 们 被 用 于 DB2 查 询 优 化 器 中 以 
进行 存 取 方 案 的 决策 。 对 于 每 一 个 统计 信息 我 们 列 出 : (D 它 出 现 的 DB2 的 目录 表 的 名 字 ，(2) 
统计 信息 名 字 ， 它 是 一 个 列 名 ， 在 它 之 下 ， 统 计 信 息 出 现在 规定 的 目录 示 中 。 每 一 个 这 样 的 
统计 信息 在 RUNSTATS 没 有 运行 时 都 有 一 个 缺 省 值 。 注 意 ， 许 多 索引 统计 信息 假设 儿 个 分 量 
的 一 个 串 接 索引 ， 我 们 假设 它 为 列 的 组 合 (C1,C2,C3 )。 


CARD 10 O00 表 中 的 行 
COLCARD | 25 在 这 个 列 中 不 同 值 的 数 日 
SYSCOLUMNS | HIGH2KEY | N.A. 在 这 个 列 中 第 一 太 的 值 

LOW2KEY | N.A. 在 这 个 列 中 第 二 小 的 划 
NLEVELS B 树 索引 的 导数 
FRETKEY. B 树 索引 的 叶子 页 面 的 数 月 
CARD 这 个 关键 字 中 的 第 一 到 C1 中 的 不 同 值 的 数 口 
FULLKEY- 在 全 部 关键 字 中 不 同 值 的 数 月 ， 全 部 分 基 。 
CARD 25 向 如 ，C1, C2, C3 
CLUSTER- 


如 果 CLUSTEREDHm 则 为 0 和 ， 本 
RATIO 如 时 CLUSTEREDeY 则 为 9596 被 这 些 索 引 值 集 艇 的 表 中 的 行 的 百分数 
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CARD/300 
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SYSINDEXES 







图 9-13 由 RUNSTATS 收 集 的 作为 存 取 方 案 决 策 的 一 些 统 计 信息 
回 到 图 9-12 中 的 表 prospects 的 统计 。 在 SYSTABLES 中 ， 在 RUNSTATS 执 行 后 ， 我 们 


看 到 表 prospects 的 一 行 ， 如 下 ， 
SYSTABLES 

EE EE 

EE 






在 SYSCOLUMNS 中 ， 在 图 9-12 前 描述 的 hobby 利 zipcode 剂 对 应 的 行将 在 NAME 列 上 和 有 
列 值 'hobby' 和 'zipcode'。 
SYSCOLUMMNS 





最 后 ， 在 下 面 的 SYSINDEXES 表 中 ， 我 们 看 到 在 图 9-12 中 列 出 的 两 个 索引 。 
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SYSIMDEXES 


FIRSTEEY | FULLEEY CLUSTER 
NAME | TRNAME | NLEVYELS MLEAF | CARD LARD RATIO 


S00 BOD 100 MOD 


| | | 
i | ro | | soon 


or | pro 3 om] ol ml 0 
| 


对 于 组 成 了 addrx 索 引 第 一 列 zipcode， 我 们 假定 值 从 00000 到 99999 ， 因 此 
COLCARD=100 000，LOW2KEY ( 第 二 小 的 值 ) 是 00001，HIGH2KEY = 99998。( 回忆 -一 下 ， 
这 是 不 准确 的 ,只 是 为 了 简单 做 的 假设 )。 对 于 adarx 索 引 ，FIRSTKEYCARD=100 000 并 且 
FULLKEYCARD = 50 000 000， 因 为 我 们 在 图 9-12 前 面 的 段落 中 假设 adarx 键 值 有 唯一 的 RID。 

上 述 表 SYSIUNWDEXES 中 的 最 右 列 CLUSTERRATIO 是 一 个 量度， 它 衡 量 对 于 表 中 的 行 的 娶 
艇 的 性 质 相 应 于 一 个 给 定 索 引 的 符合 程度 。 最 符合 时 为 100 允 ,通过 索引 检索 到 更 多 的 行 发 生 
在 图 8-19 的 干 面 的 图 形 企 。 回 顾 一 下 ， 在 更 新 造成 了 许多 行 被 移动 哎 被 插入 到 在 数据 页 面 上 
的 聚 徐 顺序 以 外 的 情况 后 ， 用 CLUSTER 子 名 生成 的 一 个 索引 也 许 森 再 有 一 个 高 的 
CLUSTERRATIO 值 。 对 于 查询 优化 器 而 言 这 个 统计 信息 的 重要 性 在 于 ; 当 CLUSTERRATIO 
值 大 于 80 名 或 更 高 时 ， 一 次 索引 扫描 将 使 用 顺序 预 取 的 方法 通过 一 个 索引 来 检索 数据 页 面 。 

图 9-14 包 含 一 个 谓词 类 型 和 由 查询 优化 器 执行 的 由 过 滤 因 子 计算 相应 公式 的 列表 。 注 意 ， 
对 于 涉及 到 子 查询 的 谓词 在 图 9-14 没 有 给 出 过 滤 因 子 的 计算 。 事 实 上 ， 涉 及 到 非 相 关于 查询 
的 谓词 可 以 用 于 索引 检索 ， 但 是 它们 的 过 证 因子 不 能 够 由 一 个 简单 的 公式 来 预测 。 我 们 将 在 


本 章 的 稍 后 部 分 讨论 子 查询 ， 同 时 我 们 讨论 连接 。 













请 词类 型 这 诚 因子 
liCOLCARD - Col<conat 同 notfCoFEconst 相 则 


捕 补 公 起 “cc* 是 任何 除了 等 号 的 比较 谓词 ， 例 子 如 下 


Col < const 或 者 {const — LOW2KEY) LOW2KEY 和 HIGH2KEY 是 浊 于 Col 昔 范 围 
Col «= const (iHIGH2KEY - LOW2KEY) | 的 两 个 端点 的 属 计 


attd const2 {HIGH2KEY ~ LOW2KEY | bekbween consu and const2) 相间 
Col not in list 与 noHCnl jin Jist}y 相 二 
pee 


图 9.14 对 于 不 同 谓词 类 型 的 过 滤 因 子 公 式 



























2. DB2 中 的 过 滤 因 子 

-- 般 地 ， 先 前 提出 的 均匀 分 布 根 设 不 总 是 对 的 。 例 如 ， 考 虑 一 个 表 上 的 gender 列 ， 这 个 表 
含有 男 童 学 校 的 大 员 。 趾 管 侦 然 有 上 人员 gender='F， 例如 工作 和 人员 和 和 教师， 但 是 显然 ， 民 公式 
(CARD(gender))=172 来 计算 过 滤 因 子 为 172 会 引起 误导 ， 使 用 这 个 假设 的 查询 优化 器 会 很 正常 
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地 做 出 错误 的 决定 。 出 于 这 个 原因 ，DB2 和 其 他 很 多 数据 库 系 统 ， 例 如 ORACLE， 提 供 了 严 
重 偏离 均匀 假设 的 各 个 列 值 的 统计 信息 。 然 而， 为 了 简单 起 匈 ， 我 们 不 深 人 讨论 这 些 统计 信 
息 ， 同 时 假设 在 下 面 的 内 容 中 均匀 分 布 假设 通常 是 可 用 的 。 


9.5 匹配 索引 扫描 、 复 合 索 引 
假设 对 于 表 prospects 用 以 下 语句 创建 了 一 个 名 为 mailx 的 DB2 索 5|: 


create index mailx on prospects tztpcode, hobby, incomeclass, age); 

这 是 一 个 我 们 用 来 有 效 处 理 通 常 类 型 的 邮件 请 求 的 索引 (我 们 一 会 儿 就 会 明和 白 这 是 什么 
意思 }， 我 们 假设 这 不 是 一 个 聚 艇 索引。 这 里 ，incomeclass 是 一 个 短 整 型 变量 ， 定 尺 了 收 
人 落 畏 ， 售 有 从 1 到 10 的 10 个 数字 ， 它 在 prespeects 行 上 几乎 是 相等 分 布 《 这 样 相 等 匹配 请 
词 有 一 个 值 为 1110 的 过 滤 因 子 )，age 是 一 个 短 整 型 变量 , 值 有 有 50 个 ， 从 16 到 65。 一旦 给 定 了 
每 列 的 CARD， 我 们 就 可 以 为 这 个 索引 计算 键 值 的 潜在 的 数目 : 

CARDIzipcode) x CARDINnobby}x CARD(incomeclass}x CARD(age)=100 000 x 
100 x 10 x 50=5 000 000 000 

因为 我 们 有 50 000 000 行 ， 我 们 可 以 把 从 三 到 mai1x 的 赋值 看 做 是 把 50 000 000 支 飞镖 放 人 
5 000 000 000 个 空位 中 去 的 问题 。 只 有 极 少数 的 空位 有 2 交 飞 镖 ， 因此， 我 们 就 可 以 假设 唯 一 键 
值 的 数 日 (FULLKEYCARD=50 000 000 )， 在 图 8-17 显 示 的 在 叶子 层 进行 处 理 时 没有 重复 键 值 。 
现在 索引 mailx 中 的 项 具有 长 度 4( 整 型 zip code)+8(nobby 属 性 )+2(ijncomec 
lassj+2(age)}+4(RID)=20 字 节 。 我 们 可 以 计算 在 每 个 页 面 上 有 FLOOR(4000/20)=200 项 。 索 引 
的 叶子 层 有 50 000 000/200=250 000 叶 子 页 面 (NLEAF=250 000 )。 往 上 的 上 一 屋 有 1250 个 节点 ， 
再 往 上 有 7 个 ， 最 上 面 是 根 (NLEVELS=4 )。 对 于 mailx 索 引 在 SYSINDEXES 行 中 相关 列 的 值 
在 下 面 的 表 中 显示 。 


SYSINDEXES 





例 9.5.1 串 接 索 引 ， 匹 配 索引 扫描 考虑 SQL 查询 : 


select name, straddr freom prospects 
Where zipeode = O2159 and hobby = “chess” and incomeclass = 10: 


尽管 申 接 索引 mai1lx 没 有 使 我 们 解决 在 只 有 索引 情况 下 的 查询 问题 ， 就 像 在 例 9.3.6 中 那 
样 ， 它 仍然 提供 了 一 个 重要 的 优点 ， 在 WHERE 子 句 中 的 三 个 谓词 zi pcode=02159、 
hobpby='chess' 和 ijncomeclass=10 可 以 在 这 个 简单 的 索引 中 被 解决 { 也 就 是 ， 需 要 的 列 
都 可 以 从 索引 中 被 检索 到 }。 三 个 相等 的 匹配 谓词 的 过 涨 因子 每 一 个 以 11COLCARD 计 算 ， 并 
且 痊 出 11100 000=0.00001( 对 于 zipcode=02159)，11100=0.01 (对 于 hobby='chess')， 
1710=0.]【 对 于 incomeclass=10 三 个 AND 属 性 联 全 给 出 一 个 过 滤 因 子 ( 1717100 000 ) 
( 171100 ) (1710)=(17100 000 000)， 因 此 我 们 期 乌有 (17100, 000 000)50 000 000=0.5 行 被 选中 。 
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( 例如， 在 一 半 的 时 间 返 回 一 行 ， 另 一 半 时 间 不 返回 结果 )。 我 们 佑 算 对 于 数据 存 肥 的 TO 代价 
是 0.5R ， 执 行 的 时 间 为 0.5/780=0.006 秒 。 

索引 扫 摘 步 台 通 过 读 到 HB 树 中 满足 zipeode=02159 and hobby='chess' and 
ijncomeclass=10 最 左 项 来 完成 它 的 搜索 。 然 后 它 从 磊 烈 右 读 出 项 ， 必 要 时 紧 接着 叶子 的 兄 
蔽 模 针 ， 宜 到 这 些 值 的 最 后 项 被 寻 理 。 你 需要 确定 所 有 要 求 的 项 ( 甚至 会 多 于 一 个 ) 都 在 
mailx 索 引 上 的 叶子 屋 的 一 个 连续 扫描 中 。 我 们 仅 期 望 0.$ 个 这 种 项 ， 因 此 我 们 期 望 所 有 项 都 
在 一 个 单个 的 索引 叶子 页 面 上 。 假 设 索引 的 最 上 两 层 被 保留 在 缓冲 区 中 ， 对 于 第 三 层 索引 页 
面 和 叶子 员 面 ， 我 们 估算 案 引 扫 摘 的 1O 代 价 是 2R，。 呈 

例 9.5.1 的 查询 是 在 一 个 复合 索引 上 执行 一 次 匹配 索引 扫描 。 匹 配 意味 着 在 WHERE 子 句 中 
的 谓词 下 配 案 引 中 的 初始 属性 。 当 我 们 处 理 在 初始 属性 上 相等 匹配 谓词 时 ， 在 索引 中 所 选 的 
RID 值 被 找 出 的 部 分 是 整个 索引 叶子 层 的 一 个 连续 的 子 区 间 。 类 似 地 ， 假 设 在 New York 的 电 
话 目录 上 ， 电 话 用 户 通 过 姓 ， 名 ， 区 或 城市 ， 最 后 是 街道 以 字母 顺 厚 排列 。 这 样 ， 对 例 9.5.1 
的 查询 就 像 通 过 姓 和 各 来 查询 电话 号 码 ， 而 不 必 知 道 街 、 区 或 者 城市 。 

例 9.5.2 上 串 接 索引 ， 匹 配 索引 扫描 考 呀 SQL 查 询 : 


select name,. straddr from prospects 
WhHere zpecode between O2159 and 04158 
and hobby = ‘chess” and i1rcomeclass = 1O: 


再 一 次 说 明 ， 在 WHERE 子 名 中 的 所 有 三 个 谓词 zipcode between 02159 and 
04158、hobby='chess' 和 jncomeclass=10 可 以 在 索 3lmailx 中 被 解决 。 通 过 使 用 一 个 
持 补 公式 (参见 图 9-14 的 对 于 BETWEEN 谓 词 的 过滤 因 于 )， 我 们 计算 对 于 放 词 zipcode 
petween 02159 ana 04158 的 过 滤 因 子 : 

CD4158 - O215937 HIGHZEEY ~- LOWZKEYY = 1999/99,9998 


大 约 为 217100=0.02。 曙 外 本 个 谓词 就 拘 以 前 一 样 用 17COLCARD 来 计算 ， 并 且 给 册 
11100=0.011 对 于 hopbvy=' chess' ) 和 1/10=0.1 (对 于 incomeclass=10)。 三 个 
AND 属 性 一 同 给 出 过 滤 因 子 (27100)J(17100)01710)=(175S0 000)=0.00002。 这 样 平均 会 有 
(21100 000}50 000 000=1000 行 会 被 选中 。 因 为 索引 不 是 聚 笋 的 ， 连 续 的 行 会 在 磁 租 上 分 
得 很 远 ， 对 于 数据 存 取 的 VO 代价 为 1000R， 需 要 执行 时 间 为 1000180=12.5 秒 。+ 列表 预 取 
不 能 在 这 里 使 用 的 原因 将 在 例 9.6.5 中 说 明 ， 基 于 没有 担 供 具 蛋 化 的 数据 。) 

索引 扫描 步骤 通过 读 到 B 树 中 满足 zipcode =02159 and hobby='chess’ and 
incomeclass-=10 最 左边 项 来 执行 它 的 搜索 ， 然 后 在 叶子 层 从 左 到 右 跟 着 兄弟 指针 读 出 , 直 
到 最 后 一 个 满足 WHERE 子 句 条 件 的 项 被 处 理 。 然 而 ， 在 这 种 情况 下 ， 要 求 所 有 的 项 在 mai1x 
索引 的 叶子 层 的 一 个 连续 扫描 中 是 不 正确 的 。 存 在 带 有 其 他 hobby 值 的 项 ， 例 如 ,插入 在 
zipcode=02159 and hobby='chess' 和 和 和 zipcode =02160 and Hopby= echess 
之 问 的 索引 项 中 。 这 也 是 一 个 索 盐 匹配 扫 撒 ， 但 是 从 串 接 索引 匹配 的 唯一 的 索引 分 量 是 
zipeodae 的 范围 zipcode between 02159 and 04158。 这 意味 者 我 们 需要 读 出 majilTx 
崇 引 的 叶子 屋 中 的 20007100 000=1150， 即 (11501250 000)=5000 页 。 我 们 可 以 用 硕 序 预 取 以 
5000S 的 代价 在 5000/800=6.25 秒 的 时 间 来 做 这 件 事 情 。 对 于 该 查询 ， 整 个 的 执行 时 间 为 6.25 秒 
(用 于 索引 扫描 ) + 12.5 秒 { 用 于 数据 页 检索 ) = 18.75 秒 。 曾 
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例 9.5.2 用 我 们 先前 用 过 的 类 似 的 方法 在 New York 电 话 目录 中 ， 查 询 每 一 个 姓 以 “Sm” 开 
头 、 名 以 “jJoha” 开 头 的 人 。 有 大 量 的 项 被 扫描 以 检索 电话 用 户 的 集合 。 但 是 情况 会 变 得 喝 
坏 。 如 果 在 WHERE 子 名 中 没有 包含 索引 的 初始 属性 ， 我 们 就 宕 肆 考 虑 一 个 非 匹 访 索 引 扫 摘 。 
例子 如 下 ， 我 们 要 从 New York 电 话 目 录 中 找 出 每 一 个 名 为 “John” 住 在 Bronx 区 的 人 ， 而 不 知 
道 他 的 姓 ， 这 是 一 个 困难 的 任务 。 我 们 不 能 使 用 目录 的 字母 顺序 来 得 到 任何 效果 ， 因 为 我 们 
根本 不 知 遵 在 哪 一 个 的 姓 下 名 会 显示 出 “John”， 这 样 我 们 不 得 不 看 完整 个 目录 。 人 仍然 ， 对 二 
这 样 一 个 查询 ,使 用 电话 目录 搜索 ( 相当 于 一 个 非 匹 配 索引 扫描 ) 比 走出 门 挨家 挨户 去 找 一 
个 拥有 电话 并 且 名 字 为 “John” 的 人 要 好 (一 个 表 扫 描 ， 类比 的 扩展 )。 


例 9.5.3 帅 接 索引 ， 非 匹配 索引 扫描 ”再 一 次 ,我们 很 设 mai 1x 索 引 已 经 存在 。 考 虑 
SQL 查询 : 
splect nama, straddr from prospects 
where hobby = “chess and incoemecslass = 10 and age = 40; 


回顾 一 下 ，hoebby 列 的 基数 是 100，incemecelass 列 是 10，age 列 是 50， 因 此 我 们 计 
算 复 台 选 择 谓 词 的 过 滤 困 子 为 (17]100)(1710(1750)=(17150 000)=0.00002。 这 网 我 们 在 例 9.5.2 
中 计算 的 过 滤 因 子 是 相同 的 ， 我 们 仍然 需要 以 1000R 的 [IO 找 价 从 表 prospects 中 检索 1000 
行 ， 总 共 12.5 秒 的 时 间 。 但 是 索引 扫描 的 情况 完全 不 同 。 因 为 这 是 一 个 非 臣 配 替 引 扫 描 ， 我 
们 需要 读 人 250 000 个 mai1lx 叶 子 页 面 的 每 一 个 页 面 ， VO 代价 就 是 250 000s ， 执 行 寺 间 为 
250 0001/800=312.5 秒 ， 大 于 5 分 钟 。 国 

1. 匹配 索引 行 描 的 定 又 

我 们 在 研究 单列 索引 时 已 经 谈 到 可 索引 谓词 的 思想 ， 现 在 正 是 给 出 执行 一 次 下 配 索 引 扫 
描 的 意 立 的 详细 描述 的 时 候 。 

定义 9.5.1 一 次 匹配 索引 扫 模 就 是 把 许多 谓词 匹配 到 单个 索引 的 列 分 量 上 以 后 检索 来 上 自 
于 一 个 家 的 行 。 至少 一 个 可 索引 的 谓词 必须 引用 索引 的 初始 列 ， 这 被 称 为 匹配 谓词 。 可 索引 
的 谓词 的 集合 可 以 匹配 复合 索引 的 一 系列 初始 列 ， 它 们 都 被 称 为 匹配 谓词 。 国 

例如 ， 考 虑 在 表 T 上 的 索引 Cl1234X， 它 是 一 个 在 列 (Cl, C2, C3, C4) 上 的 复合 索引 。 下 
面 的 复合 谓词 匹配 所 有 C1234X 案 引 寺 的 列 : 

Cl- 10 arnd C2 = 5 Bnd C3 = 20 and C4 = 25 

复合 谓词 

i2 -= 5 and C3 = 20 and Cl = 10 

匹配 C1234X 的 前 三 列 (注意 谓词 并 不 需要 列 具 有 相同 的 顺序 )。 这 与 我 们 在 例 9.5.1 中 网 
到 的 匹配 索引 扫描 类 似 ， 都 是 在 四 列 复合 索引 mai1x 的 前 三 列 有 三 个 AND 相 等 匹配 俏 词 。 
复合 谓词 

C2 = 5 and C5 = 22 and Cl 一] and Ch = 35 
在 C1234X 的 前 2 列 有 两 个 匹配 谓词 。 列 C5 和 C6 不 是 索引 的 一 部 分 ， 因此 不 能 被 匹配 。 复 合 训 词 

C2 = 5 and C3 = 20 and C4 = 25 
不 是 一 个 匹配 索引 扫描 ， 因 为 它 设 有 匹配 谓词 。 这 类 似 于 我 们 在 例 9.5.3 中 见 到 的 情况 ， 在 一 
个 四 列 的 复 人 台 索 引 的 第 二 、 三 、 四 列 是 三 个 以 AND 连 接 的 相等 匹配 请 词 。 

注意 ， 在 例 9.5.3 中 没有 匹配 谓词 并 不 意味 着 非 偿 配 谓词 的 过 滤 因 子 无 效 。 就 像 我 们 在 例 
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9.5.3 中 见 到 的 ， 谓词 依 然 具 有 把 50 000 000 行 过 滤 到 1000 行 答案 集 的 作用 。 因 为 这 是 一 个 非 匹 
配 索 引 扫 描 。 然 而 ， 整 个 索引 需要 检查 以 执行 这 个 过 滤 。 作 为 对 比 ， 在 一 个 匹配 索引 扫描 中 ， 
我 们 通常 以 在 需要 考虑 的 索引 中 的 一 个 小 的 连续 范围 的 叶子 层 项 来 结束 。( 就 像 我 们 将 看 到 的 ， 
当 涉 及 到 IN-LIST 谓 词 时 有 一 个 例外 ， 但 是 这 是 很 特殊 的 。) 

2. 谓词 稀 选 和 萍 选 谓词 

当 DB2 使 用 非 匹 配 谓词 的 过 滤 恩 子 时 ， 就 像 在 例 9.5.3 中 一 样 ， 在 它 存 取 任 何 数 据 行 以 
前 ， 它 遍历 了 大 量 索 引 的 叶子 层 项 ， 同 时 排除 了 不 符合 谓词 的 项 。 这 侍 工 作 补 称 为 是 谓词 
东 选 ， 涉 及 到 的 非 亚 配 谓 词 称 为 楷 选 谓词 。 在 谓词 筛选 过 程 中 ， 在 没有 涉及 到 匹配 谓词 但 
仍 对 应 被 计算 的 谓词 的 串 接 索 引 中 的 烈 值 被 用 来 确定 保留 或 删除 项 。 所 有 对 应 于 项 而 在 得 
选 后 被 保留 的 行 是 将 要 被 检索 的 候选 行 ， 但 是 在 这 类 筛选 发 生 氛 后 这 样 的 行 的 数 月 通常 会 
变 得 很 小 。 

就 像 我 们 在 例 9.5.3 中 看 到 的 那样 ， 谓 词 第 选 的 应 用 可 以 导致 执行 磁盘 1/O 读 索引 项 的 时 
间 远 大 于 把 行 读 人 答案 集 的 时 间 的 情况 。 第 选 谓词 和 匹配 请 词 的 不 同 点 是 一 个 很 重要 的 因 
素 ， 我 们 将 会 厦 到 ， 在 索引 存 取 中 有 谓词 筛选 不 是 由 DB2 执 行 的 情况 。 然 而， 匹配 谓词 总 是 
被 使 用 。 

匹配 索引 扫描 的 整个 概念 是 相当 复杂 的 ， 因 此 现在 让 我 们 回馈 我 们 已 经 介绍 过 的 内 容 。 
假设 在 列 (Cl, C2, C3, C4 ) 上 有 一 个 复合 索引 C1234X%X， 还 有 一 个 涉及 到 谓词 P1, P2, …,Pk 的 
一 个 复合 十 词 。 

定义 9.5.2 ”匹配 谓词 的 基本 规则 

1) 一 个 匹配 谓词 必须 是 一 个 可 索引 的 谓词 。 

图 9-15 提 供 了 一 个 可 索引 谓词 的 列表 : 相等 匹配 谓词 和 比较 谓词 、BETWEEN 请 词 ， 
LIKE 请 词 、IN-LIST 谓 询 、IS NULL 请 词 都 有 是 可 索引 的 。 通 常 ， 把 NOT 逻 辑 运算 行 附加 到 一 
个 可 索引 的 谓词 上 会 给 出 -个 非 可 索引 的 结果 。 

2) 匹配 谓词 必须 匹配 一 个 索引 的 连续 列 Cl1, C2,…'。 

这 是 -- 个 确定 它们 的 过程 。 从 左 到 大 看 索引 列 。 对 于 每 一 列 ， 如 果 在 该 列 上 至 少 有 一 个 
可 索引 的 谓词 ， 我 们 已 经 找到 了 一 个 匹配 列 和 ~ 个 匹配 请 词 。 如 果 对 于 一 个 列 设 有 找到 一 个 
匹配 谓词 就 结束 过 程 。( 还 有 其 他 规则 ， 将 在 定 久 9.5.4 中 说 朋 。) 

3) 在 一 个 索引 中 一 个 列 上 的 一 个 非 匹 配 谓词 可 以 仍然 是 一 个 是 选 谓词。 

回答 一 个 查询 的 一 个 索引 上 可 能 存在 一 个 匹配 索引 扫描 ， 同 时 在 一 个 带 有 更 好 的 更 有 效 
的 过 滤 因 子 的 一 个 不 同 索 引 上 可 能 存在 一 个 韭 匹配 索引 扫描 。 查 询 优化 器 必须 考虑 所 有 的 到 
达 存 取 方 案 的 可 能 性 。 国 

在 一 个 索引 (例如 C123X ) 开始 的 K 列 上 的 一 个 匹配 索引 扫描 的 情况 下 ，EXPLAIN 他 令 
便 建 方案 表 的 一 个 行 ， 其 中 ，ACCESSTYPE=I ACCFESSNAME=C1234X, MATHCHCOLS=K。 
尤其 是 对 应 一 个 非 匹配 索引 扫描 ， 我 们 可 以 见 到 MATHCOLS=0。 

从 定义 9.5.2 的 第 一 点 ， 我 们 看 到 匹配 谓词 必须 是 一 个 可 索引 的 谓词 。 事实 上 ,术语 “可 
索引 的 谓词 ”恰恰 就 是 指 这 个 意思 。 

定义 9.5.3 ”一 个 可 索引 的 谓词 被 定义 为 一 个 可 以 用 来 在 一 次 匹配 索引 扫描 中 匹配 一 别 的 
谓词 ， 现 在 就 是 图 9-15 的 谓词 集合 。 脐 
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Y oc 代表 >, >=,=,<=<. 但 吡 <> 不 是 可 索 
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Col betrween constl Y 在 忠 配 系列 中 必须 是 最 后 的 (参见 号 
3and const+2 配 规则 ) 





















仅 寻 一 个 匹配 询 ( 佑 见 尼 配 规则 )} 


一 
Cr Epi [Nm rc 


Predl 和 Pred2 都 是 可 案 引 的 ， 指 相亲 

除了 (C1=3 或 C1= 引 由 外 ， 它 可 以 训 
A 

或 者 任何 等 剧 式 ，not between, nnt in 


图 9-15 单个 表 上 的 可 索引 谓 启 

术语 “可 索引 的 调 词 ” 令 人 相当 迷惑 ， 因 为 它 看 上 去 似乎 隐 含 着 以 下 含义 ， 非 可 索引 的 
谓词 就 不 能 够 用 在 一 个 过 滤 补 检索 行 的 索引 中 .但 是 这 是 不 正确 的 : 非 可 索引 的 谓词 仍然 可 
以 用 于 筛选 一 次 索引 扫描 中 的 谓词 一 一 它们 仅 公 不 能 用 于 匹配 ， 就 像 我 们 在 定义 9.5.1 中 正式 
定义 匹配 谓词 以 后 我 们 详细 描述 的 那样 。 蔡 换 “ 可 索引 的 谓词 ”的 一 个 更 好 的 术语 是 “可 匹 
配 谓词 *， 但 是 不 幸 的 是 ,在 这 一 点 上 ， 更 早 的 术语 已 经 被 牢 牢 地 最 在 数据 库 的 词汇 中 了 。 

在 一 个 单列 索引 的 情况 下 ， 功 能 是 筛选 谓词 的 非 可 索引 的 谓词 是 很 少见 的 ， 但 不 是 不 可 
能 的 。 这 种 可 能 性 依赖 于 过 滤 因 子 是 否 使 得 查询 优化 颖 认为 它 是 有 价值 的 。 因 为 一 个 普通 的 
非 可 索引 的 谓词 是 Col<>const, 带 有 一 个 过 滤 因 子 (1 - LICOLCARD), 该 过 滤 因 子 接近 于 1， 
并 且 对 于 减少 检索 到 的 行 数 以 弥补 讯 取 很 大 部 分 的 索引 方面 似乎 没有 代价 上 的 节省 。 

当 我 们 面 对 不 是 相等 匹配 谓词 的 可 索引 谓词 时 ， 在 匹配 列 方面 事情 变 得 更 为 复杂 。 我 们 
重复 定 尺 9.5.2 中 的 第 二 点 的 规定 ， 同 时 加 入 一 些 其 他 的 规则 。 

定义 9.5.4 ”还 配 请 词 的 高 级 规则 

1) 从 左 到 右 看 串 接 索引 的 索引 列 。 对 于 每 一 列 ， 如 果 对 于 该 到 至 少 找到 了 一 个 可 索引 的 
谓词 ， 它 就 是 一 个 带 有 匹配 谓词 的 匹配 列 。 

2) 如 果 对 于 一 列 没 有 找到 匹配 谓词 就 结束 搜索 。 然 面 ， 由 于 一 些 原因 搜索 也 许 会 更 早 
结束 。 

3) 当 对 一 列 使 用 了 匹配 范围 谓词 《比较 形式 如 <，<=, >, >=, LIKE 谓 词 或 者 BETWEEN 育 
词 ) 时 ， 搜索 在 那 一 点 结束 。 

4) 在 一 个 匹配 谓词 集合 中 至 多 可 以 用 一 个 IN-LIST 谓 词 。 一 个 IN-LIST 中 的 第 二 个 匹配 列 
将 在 涉及 到 的 列 作 为 匹配 列 的 一 部 分 之 前 导致 搜索 结束 。 对 

如 果 我 们 假设 匹配 索引 打 描 的 思想 是 用 一 个 叶子 层 的 索引 项 的 连续 范围 来 作为 结束 ， 很 
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容易 看 到 ， 为 什么 一 个 范围 谓词 结束 了 匹配 谓词 的 搜索 。 回 顾 一 下 ， 在 例 9.5.2 中 一 个 查询 的 
二 个 AND 谓 词 引 用 mai1lx 索 引 的 头 三 行 。 然 而 ， 在 第 一 列 上 的 谓词 zipcode between 
02159 ana 04158 是 一 个 兄 转 谓词， 这 样 。 剩 下 的 请 词 就 不 是 匹配 索引 扫描 的 一 部 分 。 原 
因 在 于 ， 一 旦 我 们 限制 了 范围 谓词 的 索引 扫描 ， 满 足 剩 下 两 个 谓词 的 项 就 会 出 现在 2000 个 分 
离 的 区 间 上 ， 它 们 对 应 于 2000 个 zipcode 的 值 (分别 为 02159, 02160, 02161, … ) 的 每 一 个 并 
且 满 足 hobpby='chess' and incomeclass=10。 对 于 索引 扫描 而 言 ， 扫 描 所 有 遵守 范围 
谓词 和 把 其 余 的 两 个 谓词 作为 租 选 谓词 的 所 有 项 是 最 简单 的 。 这 样 我 们 有 一 个 相对 较 大 的 索 
引 扫描 要 执行 ， 即 使 用 顺序 预 取 也 需要 12.5 秒 的 耗 时 ， 当 用 随机 BO 时 ， 可 以 把 它 比 作 一 个 相 
对 较 小 的 行使 用 随机 LO 时 耗 时 为 25 秘 的 WO 代价 。 

IN-LIST 谓 词 是 唯一 一 个 打 稚 要 求 叶 子 层 索引 项 的 最 后 范围 是 连续 的 这 一 规则 的 谓词 。 下 
厨 给 出 C1234X 索 引 和 复合 谓词 。 


[8.3.4] Cl in (6，8，10) and C2 = 5 andt3 = 20 


我 们 在 所 有 三 列 上 表 有 一 个 匹配 谓词， 尽管 我 们 不 以 一 个 叶子 层 项 的 单个 连续 范围 来 结 
上 束 。 相 反 ， 有 三 个 连续 的 范围 ， 一 个 对 应 于 第 一 个 列 选择 C1=6， 一 个 对 应 于 C1=8， 一 个 对 应 
于 C1=10。 你 可 以 以 这 种 方式 描绘 出 一 次 带 有 一 个 IN-LIST 谢 词 的 匹配 索引 扫描， 就 像 带 有 相 
等 的 瑟 配 谓词 来 代替 IN-LIST 的 一 系列 扫描 一样。 但 是 DB2 会 因为 缺少 允许 第 二 个 IN-LIST 谓 
词 进 人 匹配 扫描 而 停止 。 这 样 复 合 谓词 : 

[9.5.2] clint6,，8，10) and C2 -= 5 and C3 fn {20,. 30，40] and C4 ”2 

将 只 有 两 个 匹配 谓词 。 在 第 二 个 C3 的 IN-LIST 谓 词 出 现 之 前 匹配 停 上 上 、 当 一 个 IN-LIST 调 
闻 用 在 一 个 匹配 索引 扫描 中 ， 方 案 表 的 行 含有 一 个 特殊 的 值 ACCESSTYPE=N。 我 们 对 于 上 述 
的 第 一 个 这 样 的 复合 谓词 有 MATCHCOLS=3， 同 时 对 于 第 二 个 则 有 MATHCHCOLS=2。 

例 9.5.4 ”查询 优化 和 复合 索引 扫描 ”假设 我 们 给 定 一 个 带 有 列 C1， C2, … 的 表 和 和 在 C1， 
C2，C3，C4 ) 上 的 索引 C1234X; 在 (C5, C6) 上 的 索引 C56X; 还 有 一 个 在 键 列 C7 上 的 唯一 索引 
C7X。 考 虑 下面 的 查询 ; 

1 select Cl. C5, C8 from T where Cl = 5 and C2 -7 and C3 <> 9; 

这 个 结果 是 在 两 个 列 Cl1 和 C2 上 的 一 个 匹配 索引 扫描 。 询 启 C3 是 不 可 索引 的 (但 是 它 可 以 
被 用 为 策 选 谓词 ]。 在 方案 表 中 ， 我 看 到 ACCESSTYPE=1，ACCESSNAME=C1234X， 
MATCHCOLS=2, 


2) select Cl, C5. CB Treom T where Cl = 5 and C2 > 一， ard C3 = 9; 


我 们 可 以 看 到 一 个 在 两 列 Ci1 和 C2 上 的 匹配 扫描 。 尽 管 第 三 个 谓词 是 可 索引 的 我 们 也 停止 ， 
因为 在 C2 上 的 谓词 是 一 个 范围 谓词 。 方 案 表 同 由 相同 。 

3) select Cl, C5, Ca from T Where Cl = $ and C2 ~ 7 and co = QB and Cb = 13; 

这 是 一 个 我 们 还 未 见 过 的 多 重 索引 使 用 的 一 种 类 型 ， 其 中 我 们 可 以 把 从 多 于 一 个 索引 的 
谓词 的 过 滤 因 子 组 合 起 来 ， 这 种 方法 将 在 这 里 使 用 。 如 果 那 种 替代 方法 不 存在 ， 查 许 优 化 郁 
将 考虑 在 以 下 两 种 方案 之 间 进 行 选择 ; 一 个 是 在 C1234X 上 两 列 使 用 匹配 案 引 扫描 ， 一 个 是 在 
C56X 上 两 列 使 用 一 个 匹配 索引 扫描 。 我 们 从 方案 表 中 将 知道 发 生 了 什么 ，ACCESSTYPE=L, 
ACCESSNAME=C56X, MATCHCOLS=2。 
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4} select Ci, C4 from T where Cl = 10 and C2 in (5, 6) and (C3 = 10 or C4 = 11); 

这 是 在 前 面 两 列 的 一 个 匹配 索引 扫描 。ACCESSTYPE=N (因为 有 IN-LIST 谓 词 )， 
ACCESSNAME=C1234X， 还 有 MATCHCOLS=2。 第 三 个 谓词 (C3=10 or C4=11 ) 不 是 可 
索引 的 ， 但 是 在 扫描 中 它 将 被 用 作为 一 个 第 选 谓词 。( 我 们 没有 抑 到 在 方案 表 中 涉及 的 笠 选 谓 
词 ， 但 是 所 有 查询 的 谓词 必须 被 用 来 过 小， 涉及 到 被 选择 索引 的 列 的 谓词 当然 被 用 作 筛 选 。) 
扫 朱 也 有 INDEXONLY=Y， 在 确定 代价 时 它 是 一 个 很 重要 的 因素 。 


$) select Cl, Cs, Ca from T where Cl -5 and C2 = 7 and C7 - 101: 


因为 C7X 索 引 是 唯一 的 ， 查 询 优 化 右 将 选择 ACCESSTYPE=I, ACCESSNAME=C7X。 方 
案 表 设 有 揭示 这 种 但 询 是 唯一 的 【返回 0 行 或 1 行 %。 

6] select Cl, C5, C8 from T where C2 = 7 and C3 ~ 10 and C4 = 12 and C5 一 15: 

这 个 查询 可 以 被 处 理 ， 或 者 通过 在 C1234X 上 的 一 个 非 匹配 索引 扫描 ， 列 C2,C3，C4， 或 
者 通过 在 C56X 上 的 一 个 匹配 索引 扫描 ， 列 C5。( 为 了 简单 起 见 ， 在 上 述 3) 中 涉及 的 多 重 索 引 
使 用 不 是 一 个 可 替代 的 。) 我 们 也 许可 以 在 方案 表 中 看 到 下 面 的 结果 : ACCESSTYPE=1L， 
ACCESSNAME=C1234X, MALICHCOLS=D。 

3. 可 索引 谓词 及 其 性 能 

模式 匹配 搜索 一 个 模式 匹配 搜索 C1 1ike'pattern'， 在 模式 中 有 一 个 前 导 的 统 配 符 
“多”"， 人 可 以 比 作 一 个 串 接 索引 的 一 次 非 丐 配 扫 描 。 谓 词 可 以 有 一 个 小 的 过 滤 因 子 ， 但 蚌 这 种 
搜索 同 使 用 一 本 普通 的 字典 来 查找 所 有 以 “action” 字 符 串 结尾 的 所 有 单词 是 类 似 的 。 在 列 Cl 
上 的 一 个 索引 必须 被 完全 扫描 以 检索 指向 适当 行 的 RID 的 集合 。 存 在 特殊 的 字典 ， 字 母 表 是 倒 
排 的 ， 如 果 一 个 DBAA 发 现 他 的 工作 贷 薪 中 有 许多 带 有 前 导 名 统 配 符 的 模式 匹配 搜索 ， 那 么 他 
应当 考虑 创建 带 有 倒 排 拼写 的 索引 列 。 这 样 如 果 列 C2 被 创建 以 包含 列 C1 创 排 的 文本 ， 那 么 在 
Cl 上 的 规定 Saction 成 为 在 C2 上 noitca%， 一 个 更 简单 的 搜索 。 

章 达 式 ” 非 索 引 谓 词 ，Col < Expression ( 图 9-15 给 出 )， 仅 仅 是 一 类 非 可 索引 的 谓词 的 一 
个 例子 。 基 本 上 ， 任 何 涉及 到 一 个 表达 式 的 比较 都 是 非 可 索引 的 。 例 如 ， 考 虑 如 下 查询 ， 

select * from T where 2 * bl <= 6; 
查询 优化 器 不 能 够 使 用 一 个 索引 来 解决 这 个 谓词 。 杖 而 ， 你 可 以 重新 诠释 这 个 谓词 为 : 
(两边 都 除 以 2 )， 现 在 就 可 以 使 用 索引 了 。 

salect * from T where Cl <= 28; 

取 一 次 访问 ”一定 类 别 的 查询 在 DB2 中 尤其 有 效 ， 它 提供 了 所 请 的 取 一 次 (索引 ) 访问 ， 
在 方案 表 中 ACCESSTYPE=I1。 这 样 一 个 查询 的 一 个 例子 如 下 : 

select Tingely from T: 

其 中 一 个 索引 同 开始 的 列 C1 共 存 。 很 明显 在 这 种 情况 下 查询 优化 器 可 以 简单 地 搜索 到 
索引 的 叶子 层 的 最 左边 的 项 并 且 检 索 C1 值 ， 这 就 是 为 什么 以 “ 取 一 次 存 取 ”命名 的 原因 。 
在 更 为 通常 的 情况 下 使 用 这 个 原则 也 是 可 能 的 。 例 如 ,下 面 的 查询 就 可 以 用 一 个 取 -次 存 取 
的 步骤 来 回 管 : 

Select mincCly from T where C1 > $5; 

(注意 C1>5 并 不 必然 意味 着 对 于 C1 的 最 小 值 是 6。 在 这 里 使 用 索引 是 很 重要 的 。) 另外 一 个 带 
有 取 一 次 存 取 的 例子 如 下 : 
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select mintCl) from T Where Cl between 6 and 10; 

select maxcC2} from T where Cl = 了 ; 

select maxtt2} from T Where cl = 5 end Ce * 30; 

select mintca) from T Where Cl = 6 and C2 = 20 and C3 between 3 and 14: 


每 -- 个 连续 的 匹配 等 价 的 匹配 谓词 三 小 了 对 于 索引 键 值 的 范围 -。 存 上 述 的 最 后 一 个 例子 
中 ，DB2 一 直 走 到 C12D3X 索 引 来 找 出 第 一 个 项 键 值守 6.20.9。 


9.6 多 重 索引 存 取 


假设 下 凋 的 索引 是 定义 在 一 个 表 T 上 的 唯一 一 个 索引 : C1X 在 (C1)} 上 ，C2X 在 (C2) 上 ， 
C345X 在 (C3, C4, C$) 上。 现在 考虑 下 面 的 查询 : 

[9.6.1] select * from T where Cl = 20 and C2 = 5 and C3 = 11: 

应 用 到 现在 为 止 我 们 已 经 学 到 的 匹配 索引 扫描 ， 查 询 优 化 器 将 选择 三 个 索引 中 的 一 个 ， 
索引 中 的 每 一 个 仪 仪 匹 配 查 询 [9.6.1] 中 的 三 个 谓词 中 的 一 人 个。 这样， 我 们 将 从 仅 使 用 三 个 谓 
词 过 滤 因 子 中 的 一 个 就 可 以 在 检索 数据 行 之 前 抽取 出 RID 值 当中 效益 ， 间 时 查询 方案 必须 检测 
剩余 两 个 谓词 的 真实 性 以 限制 检索 到 的 行 。 

但 是 ,这 是 一 个 庞大 的 无 效率 的 过 程 。 如 果 我 们 假设 谓词 中 的 每 一 个 有 一 个 值 为 11100 的 
过 滤 因 子 并 且 表 工人 含有 10 亿 行 ， 那 么 单个 谓 闻 仅仅 把 检索 到 的 行 的 数目 减少 到 1 百 万 。= 个 谓 
词 联合 起 来 就 育 一 个 组 人 台 的 过 滤 因 子 171 000 000， 把 检索 到 的 行 数 减少 到 100 行 。 所 以 ， 我 们 
问 是 否 在 检索 被 选择 的 行 之 前 有 一 种 把 匹配 不 同 索引 的 谓词 的 过 滤 因 子 组 合 起 来 的 方法 。 

事实 上 ， 有 一 种 方法 可 以 司 划 这 一 点 ， 它 提供 我 们 多 重 步 又 方案 的 第 一 个 例子 。 基 本 上 ， 
这 种 方法 从 每 一 个 索引 抽取 出 满足 匹配 谓词 的 RID 列 表 ， 然 后 ， 对 二 不同 的 索引 的 RID 列 表 相 
交 (AND )， 因 此 最 后 的 RD 下 表 对 应 于 满足 所 有 被 索引 谓词 的 行 。 来 源 于 DB2 方 案 表 的 一 系 
列 步 又 也 许 就 是 图 9-16 中 显示 的 方案 ， 其 中 ， 方 案 表 是 查询 19.6.1] 的 一 个 EXPLAIN 的 结果 。 


ACCESSTYPE | MATCHCOLS | ACCESSNAME | PREFETCH | MIXOPSEQ 
| 0 L 0 


1 
Cl 5 
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1 





图 9-16 对 于 查询 [9.6.1] 的 一 个 和 多重 索引 存 取 方 案 的 方案 表 的 行 


*。 MIXODPSEGQ=0 这 个 带 有 ACCESSTYPE=M 的 方案 行 表 明 多 重 索 引 存 取 过 程 将 要 在 表 
TNAME=T 上 开始 。PREFETCH=L 意 味 着 最 后 被 计算 的 RID 列 表 产 牛 以 后 列表 预 取 1/O 
( 我 们 在 9.2 节 未 尾 讲 到 过 ) 被 用 来 检索 表 T 中 的 行 。 

。 MIXOPSEQ=1 这 个 带 有 ACCESSTYPE=MX 的 方案 行 表 明 ， 满足 查询 的 匹配 谓词 的 带 
有 ACCESSNAME=CIlXX 的 索引 的 项 将 被 扫描 ， 使 用 哎 序 预 取 LQ。 在 人 这样 的 情况 下 ， 
MATCHCOLS=1， 同 时 在 查询 [9.6.1] 中 的 匹配 谓 户 为 Cl1=20。 因 为 遇 到 ClX 的 项 ，RID 
被 抽取 出 来 并 放 人 一 个 被 称 为 是 RD 池 的 内 存 区 域 中 称 为 RID 做 选 列表 的 地 方 。 在 所 有 
RID 被 从 这 个 C1X 存 取 步 怠 抽 取出 来 之 后 的 某 -~ 点 上 ，RID 候 选 列表 以 有 序 的 形式 放置 
使 得 以 后 的 相交 操作 步 绎 容易 执行 。 
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* MIXOPSEQ=2 和 MIXOPSEQ=3 这些 步 又 在 索引 C2X 和 C345X 上 执行 与 在 
MIXOPSEQ=1 中 相同 的 MX 呆 数 ， 对 于 这 些 索引 的 匹配 谓 闭 产生 它们 上 利己 的 RID 候 选 列 
表 。 我 们 可 以 把 连续 产生 的 RID 候 选 列表 看 做 被 推 人 到 一 个 栈 中 ， 就 像 在 一 个 逆流 兰 计 
算 器 中 一 样 : 最 近 产 生 的 列表 接近 于 栈 的 顶部 ， 并 有 和 且 由 后 和 面 的 计算 器 运算 首先 执行 。 

* MIXOPSEQ=4 ACCESSTYPE=MI 表 明 一 个 RID 候 选 列表 相交 操作 (AND ) 将 发 生 。 
两 个 最 近 产 生 的 RID 列 表 从 栈 顶 弹出 【 先 必 从 C345X 产 生 的 列表 ， 然 后 是 从 C2X 产 生 的 
列表 ) ; 它们 相交 以 提供 一 个 新 的 RID 列 表 ( 一 个 PB2 命 名 为 了 1 的 中 间 结 果 )， 同 时 这 
个 列表 被 压 人 到 栈 中 。 国 为 两 个 列表 的 RID 都 以 排序 的 形式 存在 ， 相 交 操 作 可 以 通过 建 
立 两 个 指向 在 每 个 列表 中 初始 的 RID 的 游标 很 容易 地 执行 ， 然 后 使 指向 更 低 值 的 RID 的 
游标 不 断 前 进 。 任 何 一 个 匹配 状态 出 现 ， 我 们 就 发 现 了 一 个 相交 的 元 素 。 我 们 把 这 个 
RID 值 放 入 到 IR1 列 表 中 ， 然 后 继续 把 两 个 游标 中 的 一 个 往 前 继续 移动 以 导 找 下 一 个 相 
交 的 元 素 。 正 在 前 进 的 游标 的 一 个 离开 了 列表 的 底部 时 ， 过 程 就 结 刘 了。 

:MIXOPSEQ=5 最 后 一 个 步骤 也 有 ACCESSTYPE=MIL， 这 个 步骤 把 机 项 的 两 个 RIDP 列 表 
从 栈 中 弹出 ， 即 娶 1 和 从 CIX 产 生 的 列表 。 列 表 被 相交 以 形成 一 个 名 为 了 极 2 的 新 的 RID 列 
表 ， 它 被 压 人 到 栈 中 ， 这 是 产生 的 最 终 的 RID 列 表 。 最 终 的 列表 被 用 来 检索 表 T 中 的 行 ， 
使 用 列表 预 取 WWO， 就 像 在 方案 的 初始 M 步 提 到 的 那样 。 

还 有 一 种 用 于 多 重 系 引 存 取 的 存 取 步 骂 。 带 有 ACCESSTYPE=MU 的 _ 行 表明 -个 将 弹出 

在 栈 中 的 两 个 RID 列 表 的 步骤 的 行 执 行 一 个 两 个 列表 的 RID 候 选 列 表 的 并 (OOR 操 作 )， 并 且 把 
新 的 中 间 结 果 压 入 栈 中 。 便 如 ， 用 在 上 面 看 到 的 相同 的 表 和 索引 假设 ,应 用 于 [9.6.2] 给 出 的 
查询 的 EXPLAIN 命 令 会 导致 图 9-17 所 示 的 方案 表 的 行 。 


[96,2] select * from T where Cl = 20 and (C2 = 5 or C3 = 11): 


MATCHCOLS [ACCSSNAME 





L 
CIX 5 
A 9 
345% 5 


图 9-17 对 于 查询 [9.6.2] 的 一 个 多 重 索 引 存 取 方案 的 方案 表 的 行 


图 9-17 与 图 9-16 的 不 间 点 仅 在 于 MIXOPSEQ=4 的 那 一 行 ， 其 中 执行 一 个 MU 步 又 来 对 谓词 
C2=5 和 C3=11 产 生 的 RID 列 表 做 并 (OR ) 运算 以 代替 相交 (AND ) 运算 。 在 最 后 一 步 
MIXOPSEQ=5 中 ， 这 个 并 同 C1=20 产 生 的 列表 作 相 交 操 作 { AND )。 

注意 ， 在 图 9-17 和 图 9-16 中 ， 多 重 索引 抽取 入 RID 列 表 的 连续 步 缀 被 产生 以 跟随 查询 中 请 
词 的 物理 顺序 。 自 然 计 算 的 顺序 同 查询 的 语法 是 独立 的 。 实 际 上 ， 由 查询 优化 器 产生 的 多 重 
索引 存 取 步 又 是 以 一 种 更 有 效 地 使 用 RID 池 的 顺序 进行 的 ， 通 常 这 意味 着 在 任何 时 候 ， 总 有 最 
小 数目 的 RID 列 表 存 在 ; 也 就 是 ， 组 合 RID 列 表 的 操作 应 尽早 执行 以 减 小 内 存 使 用 。 对 十 查询 
[9.6.2] 它 的 合 义 是 把 图 9-17 中 的 行 重 排 为 如 下 方案 。 
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这 个 新 的 方案 同 在 图 9-17 中 的 方案 具有 相同 的 效果 ,但 是 它 具 有 不 会 同时 有 多 于 两 个 RID 
列表 出 现 的 性 质 。 


例 9.6.1 多 重 索 引 存 取 ”考虑 表 prospects 和 带 有 在 图 9-32 中 列 出 的 统计 信息 的 
hobpbyx 和 addrx 索 引 ， 同时 假设 可 以 在 prospects 上 得 到 的 其 他 索引 只 有 在 列 age 上 的 
agex 索 引 和 在 列 ijncomeclass 上 的 ijncomex 索 引 。 一 个 小 想法 会 使 你 信服 ， 这 些 索 引 同 
nobbyx 索 引 有 几乎 相间 的 统计 信息 ， 这 是 因为 在 叶子 层 有 如 此 多 的 索引 压缩 以 致 于 在 4 字 节 
( NLEAF 也 是 相同 的 ) 的 多 重 RID 项 控制 的 项 的 长 度 中 索引 键 的 长 度 基 多 余 的 ; 在 键 长 度 更 加 
相关 的 更 高 屋 ,， 没有 足够 的 变化 去 改变 SYSINDEXES 中 的 NLEYELS 统 计 信 息 (参见 图 9-13 )。 
现在 考 上 嵌 我 们 在 例 9.5.1 中 修理 的 查 交 : 


select name, straddr from prospects 
where zipcode = O2159 and hobby = chess’ and incomeclass = 10; 


在 那个 例子 中 ， 我 们 有 一 个 串 接 索 引 mailx, 在 其 上 一 次 索引 扫 措 被 执行 。 依 据 上面 提 
到 的 单个 索引 假设 ,这 个 查询 可 以 用 图 9-18 中 描述 的 多 重 索 引 存 取 方 案 来 执行 。 
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图 9-18 儿 重 索引 存 取 方案 的 方案 表 的 行 (在 例 9.6.1 中 说 明 ) 
: 国 


让 我 们 计算 MIXOPSEQ=1 的 此 又 的 IO 代价。 这 个 步 又 扫描 对 于 请 间 hobby='chess' 的 
hobbyx 索 引 。 因 为 FF(hopby='chess')=1/100， 对 于 hobbyx NLEAF 为 50 000， 这 需要 
一 次 50 000 叶 子 层 页 (忽略 在 目录 间 的 IO ) 的 17100 的 扫描 ， 即 $003 的 IO 代价 。 这 些 叶子 层 
项 的 RID 列 表 被 抽取 油 来 ， 并 压 人 栈 中 。 

对 于 MIXOPSEQ=2， 我 们 扫描 adarx 索 引 来 解决 调 间 zijpcode=02159 并 且 抽 取出 
RID 值 放 人 入 一 个 列表 中 。 因 为 FF(zipcode=02159)=1100 000， 同 时 对 于 addrxNLEAF = 
500 000， 从 左 到 右 以 解决 这 个 谓词 的 扫描 的 叶子 页 面 数 是 (11100 000)(500 000)=5S。 对 于 
MIXOQPSEQ=2， 谓 词 incomeclass=10 有 一 个 过 滤 因 子 1/10，, 这 样 在 50 000 个 吁 子 层 页 面 
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情况 下 抽取 RiD 的 IO 代价 为 50008S 。 

现在 ， 带 有 MIXOPSEQO=3 和 5 的 ACCESSTYPE=MI 列 表 相 交 步 又 并 不 要 求 IO ， 因 为 所 有 
的 R 记 已 经 驻 留 在 内 存 中 ， 就 像 我 们 在 例 9.5.1 中 做 的 那样 ， 把 三 个 谓词 的 过 臣 因 子 乘 起 来 ， 
我 们 可 以 再 一 次 看 到 我 们 期 望 从 表 中 仅 检 索 到 0.5 行 。 当 然 ， 这 呈 是 一 个 概率 上 的 估算 . 

然而 ， 许 多 行 被 检索 到 了 ， 它 们 很 可 能 在 不 同 的 磁盘 页 面 上 ， 系 统 用 列表 预 取 来 检索 它 
们 【就 像 我 们 在 MIXOPSEQ=0 看 到 的 其 中 PREFETCH=L )。 通 过 列表 预 取 对 于 检索 0.5 页 的 MO 
代价 由 0.5L 来 指明 。 就 像 我 们 在 图 9-10 中 指明 的 IO 速度 的 经 验 规 则 ， 以 每 秒 200 次 LO 速度 进 
行列 表 预 取 。 一 个 0.5 页 的 区 表 预 取 必 于 这 条 经 验 规则 近似 值 的 低 限 〔(4 个 页 曾 )， 介 是 在 任何 
情况 焉 涉及 到 获得 一 个 期 望 半 行 的 时 间 是 不 重要 的 。 

对 于 查询 的 整个 的 基于 0UO 代 价 的 执行 时 间 计 算 如 下 : 500S+SS+50008S+0.5R， 几 
SS05/1800+0.5180， 即 大 约 为 6.9 秒 。 


例 9.6.2 多 重 索 引 存 取 在 例 9.6.1 的 索引 候 届 下， 我 们 检查 前 面 的 例 9.5.2 中 的 查 户 : 


select name. straddr Trom prospects 
where zipcode betweaen O2159 and 04158 
arnd hobby = chess’ AaAMd incomeclass = 10; 

对 于 这 个 查 说 ，zipcode 上 的 BETWEEN 谓 词 引 起 一 深 addrx 上 的 红 配 索引 扫描 ， 它 带 
有 过 滤 因 子 (2000/100 000)=1150。 因 为 对 于 addrx 而 言 NLEAF=500 000， 对 于 这 个 谓词 机 取 
出 RID 的 扫描 需要 代价 10 000S。 解 决 hobby 和 incomeclass 工 的 谓词 的 代价 同 例 9.6.1 没 有 
改变 ， 为 500S 和 40003 。 

被 这 个 查询 检索 到 的 总 的 行 数 这 例 9.5.2 中 的 相间 方式 被 计算 : 
(SOYCLALO0)1107Y(50 000 000)=1009 行 ， 很 有 可 能 在 分 离 的 页 上 。 然 而， 因为 排序 的 
RID 列 表 被 相交 以 达到 这 个 行 的 序列 ，RID 是 有 序 的 . 这 样 列表 预 取 将 节省 1000 个 磁盘 页 
面 的 IO 代 怖 。 这 个 查询 的 整个 IO 代价 由 10 0005 + 500S + 5000S + 1000L 给 出 ， 执 行 的 
时 间 是 15 500/800+ 10007200=19.4+5=24.5 秒 。 这 个 结果 可 以 同 我 们 在 例 9.5.2 得 出 的 结 
果 进 行 比较 ， 其 中 ， 我 们 假定 1000 个 数据 页 闸 110 用 随机 I/O ( 1000R ) 来 检索 ， 所 以 用 了 
12.5 秒 ， 而 不 是 列表 预 取 IO ( 1000L }， 列 表 预 到 WO 耗 时 5 秘 ， 


1. 列表 预 取 和 RID 池 

如 果 列 表 预 取 比 随机 LO 更 有 效 ， 为 什么 我 们 要 执行 随机 WHO? 管 案 就 像 我 们 在 9.2 凶 末尾 
提示 的 那样 ， 在 列表 预 取 在 PDB2 中 发 牛 以 前 需要 有 相当 特殊 的 前 所 条 件 ， 条 件 出 现在 “RID 列 
表 使 用 规则 ”中 。 然 而 ， 在 继续 讲述 以 前 ， 为 防止 可 能 的 误解 而 做 -个 申明 是 很 恰当 的 。 

直到 现在 ， 我 们 已 经 介绍 的 大 冤 数 查询 存 取 原 则 已 经 是 相当 通用 的 原则 了， 尽管 我 们 的 
例子 是 关于 DB2 特 性 的 ,我们 期 望 现 在 或 在 不 久 的 将 来 在 大 多 数 关 系数 据 库 中 看 到 等 价 的 特 
性 。 例 如 ， 在 教育 界 或 工业 界 你 有 可 能 磁 到 的 所 有 关系 数据 库 都 有 查 南 优化 器 ， 人 写 们 简 用 数 
据 统 计 信息 计算 和 比较 过 滤 因 于， 并 产生 包 舍 诸如 表 扫 描 和 和 各 种 类 型 的 索引 辅助 扫描 的 查询 
存 取 方 案 。 在 复合 索引 上 的 匹配 扫描 的 思想 和 可 以 被 匹配 或 用 于 筛选 的 特定 类 型 的 谓词 在 大 
多 数 非 DB2 产 总 上 通常 以 一 种 不 是 很 复杂 的 方式 完成 。( 匹配 拉 描 实际 上 是 DB2 特 定 的 命名 
法 。) 对 于 多 重 过 引 存 取 特 性 (通过 位 图 索引 有 时 会 更 有 效 ) 和 对 于 RID 列 表 驻 留 内 存 (或 者 
最 后 的 结果 的 位 图 ) 也 都 是 相同 的 。 这 种 思想 在 许 客 ( 还 不 是 所 有 ) 关系 产品 上 实现 ,但 是 
通常 灵活 位 少 一 些 。 本 部 分 的 主要 内 容 ， 列 表 预 取 及 其 对 于 RID 列 表 规 则 的 依赖 性 涉及 到 从 通 
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用 规则 到 产品 规定 的 设计 等 方面 。 这 些 概念 对 于 正确 理解 DB2 查 询 优 化 是 很 重要 的 。 但 是 你 
应 当 警 党 它们 不 是 基本 的 ; 事实 上， 许多 规则 有 些 武 断 ， 并 且 其 他 数据 库 产 品 很 有 可 能 选择 
一 个 不 同 的 方法 【也许 是 更 高 超 的 1 来 确定 什么 样 的 RID 列 表 (或 者 位 图 ) 在 内 存 中 有 具体 化 。 

回 到 当前 的 主题 ， 是 什么 限制 了 在 PB2 中 列表 预 取 的 使 用 ?规则 就 是 列表 预 取 仅 在 从 数 
据 页 面 检索 行 时 当 索 引 人 允许 查 济 秸 测 紫 预测 需要 被 存 取 的 行 时 被 执行 。 对 于 可 能 的 列表 预 取 ， 
锌 检索 到 的 行 的 RID 必 须 已 经 被 从 一 个 扫 擂 索引 中 抽取 出 来 并 且 放 入 … 个 由 称 为 RID 池 的 内 存 
人 存储 区域 然后 按照 页 导 的 升序 来 排序 ( 意味 着 RID 按 照 升序 )。 列 表 预 取 机 制 需 昌 这 样 一 个 
RID 列 胡 使 得 它 可 以 要 求 磁 盘 控 制 器 检索 块 ， 一 次 点 共 32 页 ， 通 过 在 一 个 磁盘 的 小 区 域 中 的 
最 有 效 的 预先 决定 的 运动 。 正 如 我 们 在 硬 9.6.1 中 论述 的 ， 我 们 假设 对 于 到 表 预 取 的 一 个 经 验 
规则 是 每 秒 200 次 IO ， 尽 管 这 个 速度 实际 土 依赖 于 取出 页 面 的 近似 值 。 

列表 预 取 总 是 被 用 来 存 取 多 重 索 引 存 取 中 的 数据 页 面 (有 时 我 们 简称 为 MX 存 取 )， 因 为 
排序 的 RID 列 表 必 须 在 方案 期 间 存 在 。 在 复合 索引 扫描 中 ， 例 如 在 例 9.5.2 的 扫描 中 1000 行 被 
检索 ， 似 乎 我 们 倾向 十 使 用 列表 预 取 来 加 速 数据 页 面 的 检索 。 选 择 列表 预 取 中 的 -一 个 限制 因 
素 通 常 是 在 RID 池 中 的 空间 问题 ， 因 为 每 一 个 RID 的 长 度 是 4 字 节 ，1000 个 RID 的 一 个 列表 将 
占用 4000 字 节 ， 大 约 为 内 存 绥 冲 区 中 一 个 磁盘 页 面 的 大 小 。 但 是 对 于 RID 的 使 用 的 鞭 他 了 县 制 
将 在 定义 9.6.1 中 过 论 。 

RID 池 内 存 区 域 的 尺寸 基于 由 DBA 选 择 的 缓冲 池 的 大 小 (在 DB2 中 实际 上 有 多 个 缓冲 池 ， 
为 了 简单 ， 我 们 仅 指 一 个 缓 溃 池 ， 并 假设 其 他 的 不 用 )。RID 池 的 缺 省 尺寸 是 缓冲 池 大 小 的 -一 
半 ， 除 了 在 版 本 2 中 它 不 能 超过 200MB 。 这 个 限制 在 当前 的 版 本 5 已 经 上 升 到 1000MB ， 人 得 是 我 
们 仍然 使 用 老 版 本 的 值 来 对 应 于 在 以 后 章节 出 琉 的 基准 测试 数据 。( 注意 ， 尺 才 的 讨论 并 不 意 
味 着 RID 池 是 缓冲 池 的 一 部 分 ; 两 个 缓冲 池 是 不 同 的 内 在 区 域 。) 对 于 了 RID 池 实际 上 只 是 在 需 
要 时 才 被 分 配 ， 并 且 以 16MB 的 大 小 递增 直到 系统 设置 的 限制 。RID 池 并 发 地 被 许多 不 同 的 执 
行 查询 的 进程 合用 ， 它 相当 节 丛 地 少量 分 配 。 通 过 下 面 一 些 版 制 性 规则 来 做 出 每 一 种 努力 以 
使 池 空 间 的 使 用 最 小 。 

定义 9.6.1 _RID 列 表 使 用 的 规则 下 面 一 些 规则 通过 查询 优化 器 控制 RID 列 表 的 使 用 。 

1) 当 查 询 优 化 器 建立 了 - -个 对 于 涉及 到 RID 列 表 产 生 的 查询 方案 ( 被 称 为 法 定时 间 ) 时 ， 
在 闻 案 中 任何 时 间 活 牙 的 可 预测 的 RID 数 自 东 能 多 于 RID 池 空间 的 S0 驼 。 如 果 的 确 需要 ， 那 么 
全 产生 一 个 替代 的 方案 ， 它 不 区 求 RID 列 表 的 建立 。 在 RID 列 表 抽 取 已 经 开始 以 后 ， 如 有 果 RID 
的 使 用 被 证 实 是 错误 的 ， 以 致 于 RID 列 表 的 产生 是 不 合适 的 ， 该 方案 被 中 止 ， 并 且 用 另外 一 个 
存 取 方法 来 回答 这 一 查询 。 

2) 在 一 个 抽取 RID 列 表 的 一 个 索引 扫描 中 不 能 使 用 筛选 谓词 。 

3) 在 一 个 抽取 RID 列 表 的 一 个 索引 扫描 中 不 能 使 用 -个 IN-LIST 谓 词 。 

上 述 规则 对 于 DB2 的 2.3 版 本 都 是 正确 的 ， 与 本 章 中 后 面 引 用 的 性 能 数据 相对 应 。 在 DB2 的 
版 本 5 中 ， 规 则 2 和 3 是 在 文 和 消 中 规定 的 ， 而 1! 却 没有 ， 也 许 是 因为 它 已 作为 内 部 的 考虑 了 。 国 

例 9.6.3 ”RID 列表 的 大 小 限制 ”再 一 次 考虑 带 有 例 9.6.1 索 3| (好 addrx, hobbyx， 
incomex ) 的 表 prospects。 我 们 在 prospects 的 一 个 名 为 gender 的 烈 上 上 ( 它 的 值 有 有 "MI' 和 'F' 
两 个 )， 添 加 一 个 新 的 索引 genderx， 其 中 ， 我 们 假设 两 个 列 值 以 等 频率 出 现 。 考 虑 如 下 查询 : 


select name, straddr from prospects 
whars zipcode Detween O2159 ard O4158 
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and ineomeclass = 10 and gernder 下 

因为 索引 正 缩 ， 我 们 看 到 genaerx 索 引 的 叶子 层 必 须 包 含 大 约 50 000 个 页 面 ， 与 hobbyx 
索引 的 数 日 相同 。 为 了 稀 顾 这 个 推理 ， 在 表 prospects 中 有 50 000 000 行 ， 并 且 对 于 RIDP 平 
均 的 叶子 层 项 ( 因为 重复 关键 字 值 的 压缩 ) 请 用 4 字 节 。 所 以 在 一 个 时 子 页 面 上 有 1000 个 项 ， 
5 于 万 项 需要 50 000 叶 子 页 面 。 现 在 考虑 我 们 将 从 索引 genderx 抽 取出 的 RID 列 表 的 大 小 以 满 
是 匹配 谓词 ， 其 中 条 件 为 FF(gender='F')=1/2。 这 个 扫描 将 遍历 350 000 页 叶子 层 的 一 半 ， 并 
且 拙 取出 所 有 RID， 一 个 25 000 页 的 RID 列 表 ， 这 是 因为 在 叶子 层 上 的 几乎 所 有 空间 都 是 由 
RID 构 成 的 。 但 是 根据 定义 9.6.1 的 规则 1， 我 们 将 不 能 够 建立 一 个 25 000 页 的 RID 列 表 ， 除 非 
我 们 有 一 个 50 000 页 的 RID 池 ， 即 200MB ，、 一 个 绝对 的 限制 【在 PB2 版 本 2.3 中 )。 根 设 在 相交 
的 同时 从 已 有 的 方案 中 必须 有 另外 一 个 RID 列 表 ， 我 们 看 到 谓词 gender='F' 也 许 不 能 使 它 
的 RID 列 表 被 抽取 出 来 。 因 为 我 们 假设 gender='F' 对 于 表 prospects 的 5 千 万 行 的 一 半 抽 
取出 RID， 很 明显 对 于 这 样 一 个 谓词 我 们 不 能 有 一 个 MX 步骤 。 多 重 索 引 方案 必须 痰 合 着 用 其 
亿 两 个 谓词 和 它们 的 过 滤 因 子 ， 同 时 从 那里 开始 继续 检索 数据 行 。 |! 


即使 在 简单 的 匹配 索引 扫描 中 ， 列 表 预 取 存 取 不 总 是 一 个 被 放弃 的 结论 。 


例 9.6.4 RID 列 表 大 小 的 限制 ”再 一 次 考虑 在 例 9.3.4 中 的 带 有 索引 hobbyx 的 表 
prospects 和 评价 的 查询 ; 

select name, straeddr from prospects where hobby = "chess": 

因为 FFE(hobby= 'chess' =l1100， 例 9.3.4 的 主要 TO 代价 是 从 表 Prospects 中 以 非 聚 篮 
咏 序 检索 (171001(50 000 000)=500 000 行 。500 000R 的 时 间伐 价 是 500 000180=6250 秒 ， 即 大 约 
2 小 时 。 显 然 列表 预 职 将 是 最 优先 的 ， 因 为 500 000L 将 以 500 000/200=2500 秘 即 42 分 钟 来 执行 。 
但 是 为 了 使 列表 预 取 发 生 ， 对 于 这 个 谓词 的 RID 列 表 必 须 拙 取 到 RID 池 中 。 有 5 和 000 个 项 被 打 
描 ， 生 成 500 000 个 RID ， 在 RID 池 中 占有 2MB 。 这 意味 着 根据 定义 9.6.1 的 规则 1 必须 有 4MB 
的 RID 池 ， 国 为 任何 方案 仅仅 使 用 RID 池 的 一 半 。 四 为 RID 池 是 缓冲 池 的 一 半 大 小 ， 所 以 必须 
提供 一 个 8SMB 的 磁盘 缓 币 【含有 2000 个 4KB 的 磁 载 页 面 )。 如 果 缓 冲 池 比 这 个 尺寸 小 ， 对 于 这 
个 音 询 束 不 能 够 应 用 列表 预 取 。 但 是 今天 在 系统 中 使 用 这 样 小 的 缓冲 池 是 不 大 可 能 的 。 国 


RID 池 规则 使 用 相当 粗粮 的 试探 法 来 设 定 资 源 范 围 。 系 统 中 正在 活跃 的 使 用 者 未 考虑 在 内 ， 
如 果 我 们 有 一 个 用 户 以 一 个 天 小 为 100MB 的 缓冲 池 热 行 例 9.6.4 的 这 个 查询 ， 那 么 限制 我 们 侈 
仅 用 50MBRID 池 的 一 半 是 不 合适 的 ， 并 且 导 致 在 没有 其 他 用 户 竞争 RID 空 间 时 不 能 执行 列表 
现 取 。 田 外 一 方面 ， 如 果 在 这 种 类 型 的 查询 中 有 几 个 用 户 都 活 贱 ,我 们 注意 到 查询 并 不 会 导 
致 要 求 缓冲 的 共用 页 的 一 个 很 天 的 集合 ， 这 样 我 们 可 以 把 一 些 缓 神 空 间 转 化 为 RID 空 间 来 支持 
更 多 的 列表 预 取 。 

在 RID 列 表 上 的 一 个 很 重要 的 限制 是 规则 3， 它 声明 生成 RID 列 表 吉 引 泣 选 不 能 执行 。 尤 
其 十 一 个 非 匹配 索引 扫 搞 不 会 导致 在 数据 行 检 索 阶 段 中 的 列表 预 取 。 更 进一步 讲 ， 因 为 MX 处 
理 要 求 RID 列 表 ，MX 处 理 不 能 利用 非 匹 配 谓 词 。 我们 将 在 一 个 例 于 之 后 再 进一步 讨论 它 。 

例 9.6.5 列表 预 取 和 索引 籍 选 回顾 一 下 例 9.5.2 的 查询 ， 其 中 prospects 上 只 有 mailx 
索引 (>ipeodae ，hobby， incomeclass， age )， 并 回忆 一 下 在 带 有 不 同 索 引 的 例 9.6.2 
中 这 个 查询 是 怎样 被 重复 的 。 


select name, straddr from prospects 
where zipcode between O2159 and O4158 
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and hobby = chess’ and Tneomec1ass = 10: 

使 用 索引 mialx， 索 引 扫 描 宇 列 zipcode 上 上 匹配， 市 不 是 证 面 的 hobby 和 
incomeclass 列 上 匹配 ， 因 此 hobby='chess' 和 ijncomeclass=10 被 用 作 饰 选 证词。 可 
以 计算 出 ，mai1lx 的 案 引 扫描 将 遍历 索引 的 (1/50)(250 000)=5000 个 叶子 页 面 ， 以 50008 的 代 
价 是 耗 时 为 5000/800=6.25 秒 ， 同 时 1009 个 数据 页 面 将 被 以 1000R 的 代价 有 即 耗 时 1000/80=12,5 
秘 被 检索 。 因 为 第 选 谓词 用 米 获 得 这 样 小 的 复合 过 滤 因 子 ， 我 们 不 能 从 这 些 1000 个 页 曾 中 抽 
取出 一 个 ID 列表 因为 规则 3 )。 用 列表 预 取 执行 这 1000 数 据 页 面 的 读 是 不 可 能 的 。 所 以 ， 
以 5 秒 的 时 间 完 成 的 一 个 1000L 的 数据 页 面 的 QO， 在 使 用 串 接 索引 时 是 不 可 能 的 就 像 我 们 在 例 
9.6.2 中 看 到 的 。 下 


过 滤 谓 词 和 IN-LIST 谓 词 不 能 用 在 RID 列 表 的 抽取 中 在 理论 上 似乎 没有 任何 重要 的 原因 ， 
就 像 在 规则 2 和 和 规则 3 陈述 的 那样 ， 除 了 了 过滤 在 一 个 索引 页 面 的 大 的 集合 上 执行 时 RIPD 列 表 将 
在 一 段 有 些 扩 展 的 阶段 使 用 以 外 。 大 概 设 计 者 正在 寻找 RID 列 表 抽 取 上 的 限制 来 为 其 他 更 有 价 
值 的 应 用 保留 RID 池 的 空间 ， 并 偶然 发 现 了 这 些 认 则 。 然 而 ， 查 询 优 化 的 更 多 细节 会 从 一 个 版 
本 到 另 一 个 版 本 的 过程 发 生变 化 ， 

2. 多 重 索 引 看 取 中 减少 返回 的 此 

在 多 重 索 引 和 存 取 中 的 另外 一 -条 关于 RIP 列 表 抽 取 的 规则 不 像 一 条 优化 规则 有 那么 多 的 限 
制 。 一 个 带 有 对 于 叶子 页 面 亡 历 的 IO 代价 的 索引 上 上 的 扫描 只 有 当 它 通过 更 大 量 地 减少 数据 页 
面 检索 来 补偿 自己 时 才 会 被 执行 。 为 了 确定 在 一 个 多 重 索 引 存 取 方 案 中 带 有 一 个 MX 步骤 的 被 
扫描 的 索引 ， 查 询 优化 器 采用 某 些 下 面 定 义 中 的 步骤 ， 


定 尽 9.6.2 在 MX 存 取 中 确定 减少 返回 点 的 步 蛙 

1) 列 出 查询 的 WHERE 子 句 中 带 有 匹配 谓词 的 索引 。 为 了 简单 起 见 ， 在 下 面 我 们 假设 每 一 
个 索引 有 一 个 匹配 谓词 的 不 相关 集合 。 

2) 按照 匹配 扫描 的 过 主因 子 值 递增 的 顺序 放置 索引 。 我 们 将 选择 在 MX 步 又 上 被 执行 的 索 
引 的 一 个 初始 序列 ， 首 先是 带 有 最 小 过 滤 因 子 的 。 这 意味 着 ， 我 们 从 具有 蝎 小 的 索引 IO 代价 
和 在 节省 数据 页 面 VO 有 更 大 效果 的 谓词 开始 ， 这 种 方法 可 以 被 证 明 具 有 优化 的 结果 。 

3) 对 于 列 出 的 连续 的 索引 ， 只 有 对 于 抽取 出 RID 列 表 的 索引 扫描 的 WO 代价 将 以 一 个 对 于 
最 后 的 行 检 索 数 据 页 而 的 一 个 减 小 的 代价 补偿 自己 时 ， 才 会 执行 MX 步骤 这 个 规则 的 一 个 最 
简单 的 例子 是 ， 一旦 我 们 到 达 了 一 些 行 ， 我 们 不 必 为 了 得 到 行 的 数目 而 读 出 一 个 新 索引 的 几 
百 页 ! 二 

事实 上 ， 事 情 有 时 候 比 这 更 为 复杂 。 例 如 ， 在 第 3 步 考 虑 的 第 一 个 索引 与 一 个 表 空 间 扫描 
相 比 也 许 并 不 能 补偿 它 自己 在 MO 上 节省 的 时 间 ， 因 此 过 程 也许 不 得 不 考虑 在 一 个 节省 是 明显 
的 之 前 使 用 两 个 索引 。 例 如 ， 如 果 在 一 个 页 面 上 有 20 行 ， 第 一 个 索引 的 1/20 的 过 恋 因 子 并 没 
有 节省 很 多 HO。 然 而 ， 过 滤 困 子 为 1115 的 第 二 个 索引 可 以 节省 大 量 的 IO。 


例 9.6.6 我 们 再 次 引用 带 有 索引 addrx， hobbyx， agex 和 incemex 的 表 
Prospects。 考 虑 查询 : 


select name, straddr from prospects 
where zipcode between O2159 and O2658 
and agp = 40 and hobby = 'chess’ and {ncomeclass = 10: 


416 条 据 肆 原 理 、 颖 六 与 性 能 


我 们 假设 使 用 凶 重 索引 存 取 ， 并 上 且 尽 力 算出 哪 一 个 谓词 可 以 补 黎 日 已 。 这 些 子 名 的 过 渡 
因子 如下 《了 以 升序 小 

1} FF{zipcode between O2159 and O2658}) = 5007100,.000 = 1/200 

2) FFihobby = ‘chess'} = 1/t00 

3) FFlage = 40) = TBO 

4} FFIincomec1ass = 10) = TI0 


把 对 于 谓词 (1) 的 过 滤 因 子 应 用 到 5 千 万 行 上 ， 我 们 得 色 检 索 到 的 (]/200}(50 000 000) 
=250 000 行 ， 当 然 是 非 聚 篮 的 ， 这 样 很 可 能 是 在 5 百 刀 不 同 的 数据 页 面 上 ， 并 且 用 列表 预 取 
来 检索 。 对 于 250 000L 的 执行 时 间 为 1250 秒 ， 我 们 忽略 索引 代价 - 

在 谓词 (1 之 后 应 用 谓词 人 27， 对 于 谓词 hjobbvy= ' chess' 的 索引 hobbyx 的 扫描 需要 许 
多 叶子 页 面 IO ， 计 算 为 (11100)10S0 000)=500， 因 此 代 芥 是 5S008S ， 需 要 时 间 为 3S00/800=0.625 
秒 。 结 果 我 们 减少 扫描 数据 页 面 的 数 日 ， 从 250 000( 结果 来 自 于 前 面 的 步 早 】 到 
(A100)(250 000)=2500， 并 且 2500L 耗 时 2500/200=12.5 秒 。 通 过 hobbyx 索 引 扫 描 的 0.625 秒 
的 时 间 ， 使 得 我 们 从 2500 秒 的 一 次 数据 扫描 到 12.5 秒 的 数据 扫描 ， 很 明显 是 值得 的 。 

在 谓词 (1),(2) 以 后 应 用 请 词 (3)， 对 于 age=40 的 agex 索 引 的 扫描 (在 例 9.6.1 中 讨论 } 需 
要 许多 叶子 页 面 的 IO， 计 算 为 (1750)(50 000) = 1000， 因 此 代价 为 10005， 执 行 时 间 为 
1000/780=1.25 秒 。 结 果 ， 我 们 把 扫描 页 的 数量 减少 到 (1750)2500)=50， 并 且 50L 执 行 时 间 为 
0.25 秒 。 通 过 索引 agex 的 1.25 秒 的 投资 可 以 得 到 数据 扫描 从 12.5 秒 降 到 0.25 秒 的 结果 ， 很 明显 
是 值得 的 。 

在 谓词 (1),(23.(3) 以 后 诬 用 谓 谢 (47》， 对 于 incomeclass=10 的 罕 引 inccomex 的 扫描 需要 
大 量 叶 子 页 面 的 UO， 计算 为 L710YG50 000)=S5000， 因 此 代价 为 50003 ， 耗 时 30001800=6.25 秒 。 
结果 ， 我 们 把 扫描 数据 页 的 数 上 且 碱 少 到 (17101(50)=4$， 并 且 5L 耗 时 0.025 秒 【近似 的 六 对 于 
agex 索 引 扫描 投 资 6.25 秒 ， 数 据 扫描 由 0.25 秒 变 为 0.025 秒 。 这 是 不 值得 的 、 在 多 重 索 引 存 取 
方案 中 的 MX 步骤 incomex 沉 引 将 不 被 扫描 。 加 


9.7 连接 表 的 方法 


在 本 节 中 ， 我 们 研究 当前 在 DB2 中 使 用 的 三 种 连接 两 个 表 的 算法 。 这 些 算法 分 别称 为 : 
谋 套 搬 环 连接 法 {nested-loop join )， 归 并 扫描 连接 法 (merge scan join ) ,混合 连接 法 
(hybrid join )。{ DB2 UDPB 现 在 实现 了 艇 套 循 环 连接 法 和 归并 扫描 连接 法 ， 仅 有 DB2 for 
OS/390 有 混合 连接 法 ) 在 执行 一 种 连接 时 , 每 一 种 连接 法 在 一 定 的 情况 下 部 有 性 能 上 的 优势 。 
还 有 其 他 一 些 方法 未 被 DB2 采 用 但 是 仍然 在 特定 的 环境 下 提供 了 性能 上 的 优点 。 例 如 ， 众 所 
周知 的 骸 列 连接 法 【hash join )。 但 是 我 们 将 把 注意 力 集中 在 由 DB2 提 供 的 连接 法 上 。 用 来 描 
述 DB2 巡 接 方 法 的 术语 是 相当 通用 的 ， 这 些 概念 中 的 一 些 在 大 多 数 数据 库 产品 中 都 已 被 实现 。 

我 们 把 两 个 表 的 连接 定义 为 是 一 个 过 程 ， 在 这 个 过 程 我 们 把 -- 个 表 的 列 同 另外 一 个 表 的 
列 组 合 起 来 用 来 回 管 一 个 查询 。 根 据 这 个 定义 ， 一 个 连接 发 生 在 一 -个 Select 语 名 的 FROM 于 司 
引出 现 盖 个 或 多 个 表 的 时 候 。 甚 至 于 我 们 对 于 来 自 于 两 个 表 的 行 司 一 个 简单 的 笛 卡 儿 积 【一 
个 表 的 积 )， 我 们 称 它 为 一 个 连接 。 就 像 我 们 看 到 的 那样 ， 一 个 带 有 FROM 子 句 和 一 个 含有 来 
自 不 同 表 的 子 查 询 的 WHERFK 子 名 的 单个 表 的 Select 语 句 ， 总 是 由 查询 优化 器 转化 成 为 一 个 等 
价 的 连接 表 的 查询 语句 。 首 先 ， 我 们 仅 考 虑 只 有 两 个 表 出 现在 FROM 了 于 名 中 的 情况 。 
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在 DB2 中 两 个 表 的 连接 通常 以 两 步 发 生 。 第 一 步 ， 仅 仅 存 取 一 个 表 ， 这 个 表 称 为 外 表 
( outer table )。 在 第 二 步 ， 第 二 个 表 即 内 胡 〔inner table ) 中 的 行 同 外 表 的 行 结 人 台 起 来 。 其 他 
与 没有 道 过 一 个 索引 被 检索 的 两 个 家中 的 列 有 关 的 谓词 ， 当 它们 被 检索 时 用 以 限制 行 。 所 有 
这 些 的 结果 是 ， 产 生 了 一 个 合成 表 (composite table )， 它 包含 该 连接 的 所 有 符合 条 件 的 行 。 
如 果 同 第 三 个 表 的 连接 是 必须 的 ， 那么 合成 表 就 成 为 下 一 步 连 接 的 和 外表。 否则 合成 表 的 指定 
到 便 提供 查询 的 答案 。 尽 管 在 -- 个 磁盘 工作 文件 中 考虑 被 完全 具体 化 的 一 个 连接 的 合成 表 的 
结果 是 最 简单 的 ， 但 是 认识 到 我 们 也 许可 以 避免 这 样 一 个 浪费 时 间 的 具体 化 也 是 很 重要 的 。 
例如 ， 如 果 一 个 用 户 只 是 想 看 结果 输出 的 前 面 20 或 者 30 行 ， 具 体 化 一 个 百 万 行 的 合成 表 就 是 
极端 没有 效率 的 。 这 样 在 戏 人 式 SQL 中 ， 当 一 个 连接 查询 上 的 游标 首先 被 打开 并 且 第 一 行 被 
检索 时 ， 我们 尽量 避免 具体 化 表 。 

1. 眶 套 宾 环 连 接 法 

考虑 下 面 的 查询 : 


[$.3.1] select T1 Cl1，T1C2，T2f3，T2.C4 from Tl, T2 
where Tl,Cl = 5 and TI.ra = T2,.C3; 


在 帕 侠 循环 连接 中 ， 在 循环 的 诅 套 对 中 被 称 为 外 表 的 表 对 应 于 循环 的 幅 套 对 中 的 “外 循 
环 " ， 联 像 我 们 在 图 9-19 中 见 到 的 伪 代 码 。 假 设 [9.7.1] 的 Select 语 句 中 的 表 T1 是 外 表 ， 和 能 套 连接 - 
的 第 一 步 确 定 在 Tl1 中 并 且 满 足 在 T1 上 相应 谓词 的 行 ， 在 本 例 中 为 T1.C1=5。 如 果 我 们 假设 在 表 
Tl 的 列 C1 上 存在 一 个 索引 C1X， 那 么 连接 的 第 一 步 将 给 出 方案 表 中 的 一 行 ， 它 具有 下 列 相关 


列 的 值 。 
PLAN TAB | ACCESS | MATCH | ACCESS SORTN_ 
NO METHOD i TYPE COLS x 一 一 


Rl]; FIND ALL ROWS Tl.* IN THE OUTER TABLE TIL WHERE Cl = $; 
FOR EACH ROW Tl1,.* FOUND IN THE QUTER TABLE; 
Rz : FIND ALL ROWS T2,* IN THE INNER TABLE WHERE TILC2 = T2.C3: 





FOR EACH ROW FT2,* FOUND IN THE INNER TABLE 
RETURN ANSHER: TlicGi, Tl.Ce, Ta.C3, Te.C#d; 
END FOR: 
END FOR: 





图 9-19 对 于 舱 套 循环 连接 的 伪 代 码 (说 明 查 询 [9.7.1] ) 


方案 表 的 行 表示 加 下 会 尺 ; 我 们 正 使 用 一 个 多 步 方 案 ( PLANNO=1 ) 的 第 一 步 ; 还 没 
有 使 用 连接 的 方法 (METHOD=0 ) ; 我 们 从 连接 的 第 一 个 表 (TABNO=1 ) 中 抽取 出 行 ， 同 
时 使 用 一 个 在 索引 C1X 上 上 带 有 一 个 匹配 列 的 索引 扫描 步 绎 ; 我 们 可 以 用 列表 预 取 检 索 表 了 T1 
中 的 行 。 

既然 外 表 的 行 已 经 被 确定 了 (它们 实际 上 还 没有 拙 取出 来 )， 一 个 循环 被 执行 以 检索 出 这 
些 行 的 每 一 行 。 对 于 外 表 中 符合 条 件 的 行 ， 在 内 表 T2 上 又 执行 一 次 检索 ， 所 有 满足 连接 两 个 
表 的 连接 谓词 T1.C2=T2.C3 的 T2 的 行 被 检索 到 。 注 意 ， 因 为 对 于 这 次 检索 T1 的 行 是 固定 的 ， 
我 们 可 以 把 T1.C2 的 值 看 做 似乎 是 一 个 常数 KK。 那 么 ， 从 T2 检 索 的 行 恰 怡 就 是 满足 具有 
T2.C3=K 形 式 的 谓词 的 那些 行 ， 同 时 表 T2 的 列 C3 上 的 索引 C3X 将 使 得 这 个 索引 更 为 有 效 。 岂 
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套 循 环 连接 的 第 二 步 使 用 C3X 索 引 在 方案 表 中 具有 下 列 行 : 


PLAN TAB | ACCES MATCH | ACCESS SORTN_ 
i 一 一 Ds iT NAME PREFETCH ~ 


这 个 方案 表 和 的 这 行 表明 是 它 是 一 个 多 步 计 划 的 第 二 步 ( PLANNO=2 ) ; 被 使 用 的 连接 方 
法 是 襄 套 循环 连接 法 (METHOD = 1) ; 通过 使 用 一 个 索引 扫描 步骤 ( 它 在 索引 C3X 上 有 一 个 
匹配 列 )， 我 们 从 连接 的 第 二 个 表 中 拙 取 出 行 (TABNO = 2 )， 事 实 上 第 一 个 表 是 T2， 我 们 使 
用 列表 预 取 从 这 个 表 中 检索 行 。 图 9-19 包 含 刚 才 介 绍 的 两 步 方 法 的 过 程 伪 代 码 。 图 9-20 通 过 
使 用 指定 的 表 T1 和 T2 盖 明了 对 于 查询 [9.7.1 的 调 套 循环 连接 的 方法 。 





5 
5 
5 
5 
5 
5 
5 
5 


select Tl.Cl, Tl.cC2, T?,.C3, T2.cC4 from Tl, 
Where Tl.Cl = 5 and Tl.c2? = T2.03 





图 9-20 伦 套 循环 连接 ( 一 明 查询 [9.7.11 ) 


注意 ， 在 图 9-19 中 的 标签 R1 和 R2 指 明了 在 连接 过 程 中 的 检索 。 限 制 任意 一 个 表 中 的 行 的 
额外 的 户 词 被 加 到 相应 的 检索 中 。 任 一 个 检索 都 可 以 用 一 个 索引 扫 摘 【我 们 在 上 面 假 溉 的 ) 
或 一 次 表 扫 描 执 行 。 外 表 仅 有 一 个 检索 ， 而 内 崎 有 许多 检索 ,它们 的 数 是 同 在 和 外表 中 符合 条 
件 的 行 的 数 日 相同 。 连 接 的 VO 代价 通过 下 面 的 公式 给 出 

COSTuo( 帆 套 循 环 连 接 )=COST,o(l 外 表 检 索 )+ 

外 表 中 符合 条 件 的 行 的 数量 x TO 

幅 套 循环 连接 成 为 连接 大 的 表 的 一 个 合适 的 算法 ， 我 们 通常 期 望 看 到 在 内 表 的 此 配 剂 上 
的 一 个 索引 来 确保 高 效 的 检索 。 在 限制 滑 词 被 应 用 后 当 来 自 半 外 表 的 符合 条 件 的 行 的 数目 
很 小 时 或 者 当 内 表 足 铝 小 以 致 于 所 有 的 索引 和 数据 磁盘 页 面 可 以 在 内 存 缓冲 区 中 常 驻 时 ， 垦 
套 循环 连接 尤其 高 效 。 

例 9.7.,1 假设 我 们 给 出 两 张 表 : 含有 列 C1 和 列 C2 的 表 TABL1， 含 有 列 C3 和 C4 的 表 
TABL2， 每 个 表 有 1 百 万 行 ， 每 行 200 字 节 。 我 们 希望 估算 用 谋 侈 循环 连接 执行 下 列 查询 的 W/O 
代价 : 


Select Tl.C1l, Ti.C2, T2.C3, T2.C4 from TABL1 Ti1, TABL2 T? 
where Tl.Cl = 5 and T2.C4 = 6 and Tl.C2 = T2 ,C3; 
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我 们 假设 : 在 TABL1 的 列 CI 上 存在 一 个 非 事 艇 的 索引 CIX， 在 TABL2 上 有 列 C3 上 的 索引 | 
C3X 和 列 C4 上 的 索引 C4 及 。 假 设 这 些 请 词 的 过 滤 因 子 以 如 下 方式 给 出 : 
FRC]1=const}=FF(C4=const)}=1/100; FF(C2=const}=1/250 O00;FF(C3=const}=E/500 000。 我 们 
以 这 样 一 个 问题 开始 : 这 个 查 闸 检索 到 多 少 行 ? 在 我 们 回答 问题 之 前 ， 最 好 有 一 个 特定 的 连 
接 方法 在 头脑 中 ， 就 像 我 们 在 下 面 的 IO 代价 分 析 中 看 到 的 那样 . 

对 于 回 管 这 个 查询 的 一 个 可 能 的 明 佑 连接 方案 我 们 将 以 执行 时 间 计 算 JMO 代 价 ， 其 中， 外 
表 为 TI1 (TABL] 更 短 的 别名 )， 内 表 为 T2 (TABL2 的 别名 )。 我 们 考 虚 的 方案 包含 下 列 步 又 : 
(1) 使 用 CI1X 索 引 ， 检 索 来 自 于 TI1I 的 所 有 满足 T1C1=5 的 行 ; (2) 对 于 每 一 从 外 表 T1 检 索 到 的 行 ， 
认为 T1.C2 是 个 常数 ， 重 命名 为 KK。 使 用 索引 C3XX， 检 索 内 表 T2 中 的 所 有 使 得 T2.C3=k 的 行 。 
当 从 这 个 索引 扫描 的 行 被 检索 时 ， 通 过 确认 谓词 T2.C4=6 来 进一步 限制 行 。( 注意 ， 这 里 并 不 使 
用 索引 C4X%X， 我 们 在 下 面 会 解释 ， 我 们 仅仅 用 T2.C3=K 子 句 检 索 两 行 ，C4X 索 引 的 进一步 使 用 
将 命中 减 小 返回 的 点 ); (3 显示 出 外 表 行 TI1.C1 和 T1.C2， 以 及 对 于 符合 和 茶 件 的 内 表 行 的 T2.C3 
和 T2.C4。 

下 面 的 表格 显 东 出 这 个 策略 的 方案 表 中 的 行 。 


on Re [i fer 
NO METHOD | NO | TYPE COLS NAME PREFETCH | JOIN 

| 
exT 1 | ww 


使 用 过 滤 因 子 和 Tl 中 行 的 数目 ,在 步 矣 (1) 中 从 Tl 中 检索 到 的 行 的 数目 大 约 为 
(7100)(1 000 000)=10 000 行 ， 有 可 能 都 在 不 同 的 页 面 上 上。 对 于 PLANNO=1 的 行 告诉 我 们 
使 用 列表 预 取 。 假 设 对 于 这 个 索引 的 IO 代价 相对 于 数据 页 面 IO 代价 而 言 是 下 重要 的 。 所 
以 ， 我 们 假设 COST, .=( 外 表 索 引 )=10 000L， 执 行 时 间 为 10 000/20=50 秒 。 

对 于 每 一 个 符合 条 件 的 外 表 的 行 ， 我 们 假设 值 TI1.C2( 重 命名 为 KJ)， 在 列 T2.C3 的 值 范围 以 
内 。 因 为 FF(C3=const}=1/500 000， 我 们 期 望 在 1 百 万 行 的 表 中 检索 出 2 行 。 对 于 每 一 个 新 的 
T2.C3 的 值 要 求 一 个 到 索引 C3X 的 叶子 层 的 随机 IO (假设 上 层 目 录 节 点 在 内 存 缓 冲 区 内 )， 然 
后 ， 两 个 ID (平均 ) 检索 出 包含 有 两 行 的 两 个 页 面 。 因 此 ， 对 于 10 000 次 不 同 内 部 循环 步 又 
的 IO 代价 为 10 000 x (1R+2R)。 在 这 种 情况 下 , 我 们 将 正常 地 执行 一 次 列表 WO 以 检索 数据 页 面 ， 
但 是 回忆 一 下 ， 把 两 页 的 列表 预 取 认为 发 生 在 2/1100 秒 ， 这 会 令 人 误解 的 ， 因 为 有 太 少 的 页 面 
被 检索 到 以 分 捧 磁 盘 臂 的 寻 道 时 间 和 旋转 延迟 。 更 为 合理 的 是 把 这 个 检索 考虑 为 等 价 于 2R ， 
所 以 对 子 内 层 循环 的 执行 时 间 被 计算 为 10 000x (CR)， 即 30 000/80=37S 秒 。 总 共 的 执行 时 间 为 
S0+375=425 秒 。 

现在 确定 在 这 个 查询 中 有 和 多少 行 ， 我 们 看 到 从 表 T1 中 检索 到 10 000 行 ， 对 于 在 T1 中 的 每 
一 行 有 两 行 (平均 ) 从 T2 中 同 它 相连 接 。 所 以 ， 在 这 个 点 上 大 约 可 检索 到 20 000 行 ， 从 这 以 
后 ,一 个 条 件 测 试 发 生 了 ， 它 测试 检索 到 的 行 是 否 满足 T2.C4=6。 用 过 滤 因 子 1/1100， 检 索 到 
的 行 的 最 终 数 目 为 (17100)20 000=200。 加 

2. 归并 连接 

归并 连接 在 其 他 文章 中 也 被 称 为 归并 扫描 连接 (merge scan join ) 或 排序 归并 连接 sort 
merge join )。 上 再 一 次 考 虚 例 9.7.1 的 查询 ， 使 用 相同 的 索引 假设 。 
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[9.7.2] select Tl.C1, T2.C2, T1.C3, T2.C4 from TABLI Ti. TABLZ TF2 
where Tl.Cl = 5 and Toca = 6 and Tl.c2e = Ta.Cd: 

归并 连接 方法 对 于 两 个 表 仅 扫描 一 次 ， 以 它们 连接 的 列 的 顺序 进行 。 在 [9.7.2] 的 Setect 许 

名 中 ，DB2 以 应 用 非 连接 的 谓词 和 创建 中 间 表 开始 ,我 们 首先 计算 查 调 select C1，C2 

from Tl where Tl.Cl=5 order py C2, 把 结果 行 庆 和 人 一 个 舍 有 列 C1 和 C2 的 中 间 表 [ITl 


中 ， 了 CC2 为 序 存 放行 。 然 后 我 们 计算 查询 Select C3， C4 from T2 where Cd-6 
order by C3, 以 得 到 含有 列 C3 和 C4 的 一 个 中 间 表 IT2， 以 C3 为 序 存放 行 。 注 意 ， 通 常 这 些 
中 间 表 IT1 和 IT2 都 很 大 ， 所 以 不 能 放 和 人 内存。 它们 作为 临时 表 写 人 人 黎 盘 工作 文件 ， 行 的 排序 
是 基于 磁盘 的 排序 ， 稍 后 对 此 进行 说 明 。 

现在 我 们 准备 执行 归并 的 过 程 ， 正 是 这 个 过 程 使 归并 算法 得 到 它 的 和 名称。 要 在 IT1 和 1T2 
执行 一 次 归并 连接 ， 我 们 使 一 个 指针 局 每 个 中 间 表 相关 联 ， 初 始 指向 每 一 个 表 的 第 一 行 。 当 
过 程 进行 中 两 个 指针 都 向 前 移动 ， 使 得 对 于 两 个 表 中 的 行 任 何 匹 配 的 C2AmC3 值 都 被 检 测 到 。 了 内 
了 在 IT1 中 允 重 相等 的 值 C2 和 [IT2 中 多 重 相等 的 值 C3 匹 配 这 种 情况 以 外 ， 两 个 指针 都 通过 表 的 
行 一 直 往 前 移 ， 并 且 检 测 出 所 有 存在 的 匹配 值 IT1.C2=IT2.C3。 在 图 9-21 的 伪 代 码 中 ， 被 指针 
P1 指 向 的 表 IT1 中 行 的 C2 和 值 用 Pl 一 C2 表示 ， 人 在 表 IT2 中 也 类 亿 地 表示 为 P2 一 C3。 


CREATE TABLE IT] AS: SELECT Tl, C2 FROM Tl WHERE C1 = 5 ORDER BY C2; 
CREATE 下 ABLE IT? AS: SELECT C3, Cd FROM Tl WHERE C4 = 6 和 RDER BY C3; 
SET P1 POINTER TO FIRST ROW OF IT1: i* OUTER TABLE 


SET Pz POINTER TO FIRST ROW DF IT2: i* INNER TABLE 
: WHILE (CTRUEY { fx LOOP UNTIL EXIT MJ LOOP 


WHILE {Pl -> LCL2 > P2 -> CL3} { fa IF P2 NEEDS TO ADYANCE 
ADYANCE P22 10 NEXT RON 1H ITe: i ADVYANCE IT 
IF ¢P2 PAST LAST ROW) EXIT MJ LOOP; i* OUT OF ROWS, EXiT 


] 
WHILE tiPl -> C2 < P2 -2 C3) 0 i* IF Pl NEEDS TO ADVYANCE 


ADVANCE Pl TO NEXT ROW IN ITE: i* ADYANCE IT 
IF CP] PAST LAST ROW) EXIT MJ LOOP: A* OUT OF ROWS, EXIT 


] 


IF 《P1 -> Ce o— Pa-2> 03) { i FOUND MATCH ON JOIN 


MEMP = Pe2; i* REMEMBER Pz START POINT 


WHILE (P1 -> C2 m= P2 -> C3 { i* LOOP 
RETURN ANSWER: ITL Cl, ITl.C2, IT2.C3. IT2,C#; 
ADYANTE P2 TO NEXT ROW IN IT2; i* ADVANCE P2 
] i# LODP CONTINUES IF P2 -> C3 IS UNCHANGED 
} /二 DONE WITH JGIN MATCH 
/SINCE FELL THROUGH, P2 -> C3 IS NEW OR BEYONG END OF TABLE 
ADYANCE Pl TO MEXT ROW lM 1T1; 7 二 ADVYANCE Pl 
IF (PAST LAST RON EXIT #) LOOP: zs OUT OF ROWS, EXIT 
IF (Pl -> C2 一 MEMP -> C3) i* IF NEXT Pl-» Ce Ls SAME 
P2 一 MENMP; 7 二 START OVER WITH P2 
i* END OF MY LOOP 





图 9-2i 归并 连接 的 伪 代 码 ( 说明 查 向 [9.7.2] ) 


图 9-22 说 明了 对 于 查询 [9.7.1] 的 归并 连接 的 方法 ， 它 使 用 指定 的 表 T1 和 TF2。 一 旦 在 图 9-21 
的 伪 代 码 中 发 现 一 个 匹配 ， 我 们 保持 P1 冉 定 ， 然 后 使 P2 前 进 , 通 过 所 有 的 重复 值 。 然 后 我 们 
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使 Pl 前 进 ; 如 时 我 们 发 现 一 个 重复 值 ， 这 是 我 们 把 指针 往 后 移 的 唯一 一 种 情况 ， 这 时 ， 我 们 
设置 FP2=MEMP， 再 一 次 在 P2 的 重复 值 中 搜索 。 很 明显 ， 如 果 有 许多 C2 和 C3 的 值 相同 的 情况 ， 
那么 就 会 有 许多 行 被 连接 ， 这 样 内 层 特 环 就 有 巨大 的 结果 。 然 而 ， 通 常 说 来 ， 在 一 个 表 中 间 
只 有 很 小 一 部 分 行 会 匹配 另 一 个 表 中 的 一 个 以 上 的 行 ， 这 是 因为 我 们 通常 不 会 在 在 具有 大 量 
重复 值 和 的 别 上 懒 连接 操作 ( 参见 6.7 节 的 关于 向 损 和 无 损 分 解 的 内 容 )。 在 任何 情况 下 ， 查 询 
优化 器 使 用 项 存 的 统计 信息 就 可 以 确定 重复 值 的 可 能 的 数量 ， 并 且 用 大 多 数 的 计算 机 资源 来 
找 出 任何 匹配 是 很 可 能 的 . 


oh TN Cn LT Cnm Cn tm 


slect Tl.Cl, Til.C2, Te.C3,. Te.C# from T1， 
Where Ti.tl = 5 andTl.C2 -= T2.c3 


图 9-22 归并 连接 ( 庶 朋 查询 [9.7.1] ) 





例 9.7.2 我 们 用 一 个 归并 连接 来 重复 例 9.7.1 的 连接 查询 ， 


seTlect T1 ,人 1，THiC2，T203，T2-C4 From TARBLL Tl, TABL2 T? 
where Tl.Cl = 5 and TC4 = 6 and Tlbz2 = Te.C3: 


我 们 都 做 相同 的 假设 : 非 聚 答 索 3 引 | 依然 在 TABL1 的 列 Cl1 上 存在 ， 还 有 TABL2 中 列 C3 和 C4 
上 的 索引 C3 针 和 C4 叉 。 现 个 表 含 有 一 百 力 行 ， 每 一 行 有 200 字 节 ， 我 们 有 过 滤 因 子 
FF(C1=const)=FF(C4=const}=1/100, FF(C2=const}=1/250 000, FF(C3=const)=1/500 000。 在 例 
9.7.1 的 若 套 连接 中 ， 我 们 使 用 索引 C1X 和 C3X。 

阿 答 带 有 一 个 归并 连接 查询 [9.7.2] 的 策略 包括 下 殉 步 又 : (1) 使 用 索 31C1X， 从 T1 中 检 
索 所 有 满足 T1.C1=5 的 行 (有 10 000 行 )， 输 出 列 C1 和 C2 的 值 到 IT1 中 ， 根 据 C2 的 值 对 里 果 进 
行 排序 ， (2 ) 使 用 索引 C4X， 检 索 所 有 来 自 于 T2 并 日 满 足 T2.C4=6 的 行 (也 是 10 000 行 ) 输 
出 结果 列 C3 和 C4 的 值 到 IT2， 并 且 对 它们 进行 排序 ， 

然后 ， 采 用 上 述 的 伪 代 码 执行 归并 连接 步骤 。 归 并 连接 方案 在 下 表 中 说 明 。 注 意 ， 
SORTN_JOIN 列 表明 获得 IT1 和 IT2 是 需要 排序 的 。 





正如 以 前 论述 的 ， 步 骤 (1 需要 从 TI.CI1 叶 子 度 索引 读 取 10 000 项 ,这 我们 认为 是 不 重 
要 的 ， 紧 接 者 是 10 000L 的 VO 代价 用 来 检索 来 自 于 数据 页 和 面 的 索引 行 。 如 时 我 们 假 俊 每 一 个 
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被 排 取 的 C1 和 C2 的 值 需要 10 个 字 节 ， 那 么 具体 化 IT1 需 要 200 000 字 节 ， 大 约 50 页 。 考虑 这 种 
排序 完全 在 内 存 中 进行 是 合适 的 ， 因 此 步 绊 (1) 的 WO 代价 为 10 000L。 相同 的 考虑 可 以 应 用 
于 步 又 (2 )。 对 于 该 方案 总 的 代价 为 20 000L， 耗 时 100 秒 ， 比 例 9.7.1 的 艇 套 连 接 有 所 提高 ， 
例 9.7.1 需 要 425 秒 。 优 点 来 自 于 在 归并 连接 中 使 用 索引 C4 外 以 获得 从 TABL?2 中 更 为 有 效 的 批 其 
检索 - 图 

注意 ， 从 表 T1 中 抽取 出 行 放 入 中 间 表 IT1 中 并 不 总 是 必要 的 。 和 如果 在 T1 上 有 人 允许 我 们 用 请 
词 T1.C1=5 限 制 T1 的 行 的 索引 ， 并 且 仍 然 以 TI1.C2 为 序 存 取 行 ，DB2 当 然 采 用 那 种 选择 。 例 如 ， 
如 果 TI 在 〈《C1, C2 ) 上 有 索 3|C12X， 对 于 带 有 给 定 谓词 的 该 罕 引 的 匹配 扫描 将 提供 以 C2 排序 
的 T1 的 行 ， 这 是 可 能 的 。 相 同 的 考虑 对 于 T2 也 成 立 。 

归并 连接 不 总 是 一 个 好 的 策略 。 


select Tl.CS, Tl.C2, Te.* trom TABRL1 Tl. TABLZ Te2 
where [lts = 5 and Tlic = T2.03: 


我 们 假定 索引 C2X，C3X 和 CS5X 在 表 T1 和 T2 的 相应 列 上 存在 ， 有 具有 例 9.7.1 和 例 9.7.2 中 的 过 
滤 因 子 FF(C2=consty=1/250 000, FF(C3=constD)=1/500 000 和 一 个 新 的 过 滤 因 子 FE(T1.， C5=const) 
=171000。 可 以 用 下 述 的 方法 来 计算 对 子 TI 的 能 套 循 环 连接 的 IO 代价 。 在 T1 中 查找 满足 
Tl.C5=5 的 1 000 行 ， 我 们 有 一 个 索引 查找 的 代价 1R( 对 于 索引 )+1000L (对 于 数据 页 面 六 对 
于 外 表 T1 的 每 一 行 ， 我 们 设置 T1.C2= 玉 ， 然 后 在 内 表 中 寻找 满足 T2.C3=K 的 行 ， 大 约 有 两 行 ， 
对 于 索引 页 项 查询 需要 1R， 对 于 行 检索 需要 2R。 内 层 循环 的 IO 代价 计算 为 1000 x (3R)=3000R 。 
这 样 整个 艇 套 循环 连接 的 代价 是 3001R+l000L ， 耗 时 3001/80+1000/200， 即 大 约 为 42.5 秒 。 

对 于 归并 连接 ， 我 们 按 如 下 方法 计算 代价 。 我 们 可 以 很 容易 地 计算 IT1 的 抽取 需要 10 秒 的 
MO， 人 重 是 我 们 可 以 看 到 ， 与 消耗 在 循环 连接 上 时 间 相 比 ， 这 是 不 重要 的 。 因 为 在 T2 上 没有 像 
我 们 在 例 9.7.2 中 的 独立 的 限制 谓词 (T2.C4=6 )， 我 们 可 以 有 两 种 选择 ， 一 种 是 通过 索引 C3X 
整齐 地 存 取 T2 的 行 来 执行 归并 ， 另 外 一 种 是 具体 化 并 且 对 对 整个 表 T2 排 序 生 成 中 间 表 IT2 。 
在 第 一 种 情况 下 ， 我 们 将 通过 非 娶 得 索引 以 一 个 1 000 000R 的 数据 页 面 存 取代 价 存 取 T2 所 有 
的 行 ， 显 然 ， 这 不 是 一 个 好 的 策略 -《 这 里 我 们 不 会 使 用 预 取 TO ， 因 为 我 们 不 想 以 RID 为 序 
检索 行 。) 在 第 二 种 情况 下 ， 我 们 需要 以 一 百 万 行 每 行 200 字 节 具 位 化 表 IT2《( 注 意 ，T2 中 的 
所 有 列 都 在 选择 列表 中 )， 同 时 按照 C3 对 结果 行 排 序 。 我 们 推迟 考虑 磁盘 排序 ， 但 是 需要 指 
出 ， 这 些 行 的 磁盘 排序 也 许 需 要 两 这 扫描 磁盘 页 面 ， 写 出 第 一 稳 扫 擂 的 结果 ， 然 后 在 为 第 二 
遍 扫 描 读 人 这 些 结 果 ，LO 代 人 和 价 大 于 100 000S， 耗 时 100 000/800=125 秒 。 显 然 ， 说 套 衔 环 策 
略 是 较 好 的 。 加 

3. 混合 连接 

混合 连接 方法 (在 IBM 分 类 中 METHOE=4) 与 由 套 循环 连接 和 归并 连接 相 比 很 少 使 用 ， 为 
了 简单 起 见 ， 我 们 只 对 使 用 的 算法 做 文字 上 的 描述 。 

混合 连接 算法 的 描述 一 个 两 个 表 之 间 的 混合 连接 有 一 个 外 表 和 一 个 内 表 ， 就 像 屿 套 循 环 
连接 和 归并 连接 算法 中 的 一 样 。 第 一 步 同 外 天 的 归并 连接 。 以 连接 列 的 顺 序 对 表 进行 一 次 扫 
描 ， 或 者 通过 一 个 索引 ,或 者 抽取 由 一 些 谓词 限制 的 行 的 集合 到 中 间 表 IT1 以 后 。 当 外 表 的 行 
以 连接 列 的 顺序 被 扫描 时 ， 内 表 的 匹配 连接 列 值 通过 在 连接 列 上 的 一 个 索引 被 扫描 。 然 而 ， 
肉 表 的 行 还 有 是 没有 存 取 ; 相反 ， 来 自 于 外 表 的 行 ， 它 有 一 个 给 出 在 内 表 中 每 一 个 匹配 连接 行 
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的 RID 值 的 额外 列 ， 被 写 人 一 个 中 间 表 IT2。 然 后 ，IT2 的 行 以 RID 的 顺序 排序 ， 同 时 列表 预 取 
用 米 拾取 来 自 于 内 表 的 列 以 问 外 表 的 行 连接 。 


例 9.7.4 再 一 次 考虑 例 9.7.3 的 连接 查询 : 


select Tl CS, Tl.C2, T2,* from TABL1 Ti, TABL2 T2 
where Ti.C5 = § and Tl.Cea = T2.C3: 


就 像 在 例 9.7.3 中 那样 我 们 假定 在 表 T1 和 T2 的 对 应 列 土 有 索 31C2X, C3X 和 C5X， 人 它 具 有 
在 例 9.7.1 和 和 例 9.7.? 中 的 过 滤 因 子 FF(C2=constY=17250 000, FF(C3=econst)=1/500 000， 
FF(T1.C5=const)=171000。T1 作 为 外 部 表 的 一 个 混合 连接 的 IO 代价 计算 如 下 。 在 T1 中 满足 
T1.C5=5 条 件 的 有 1000 行 需要 查找 ， 我 们 知道 … 个 索引 查找 的 代价 为 1R ( 对 于 索引 ) +1000L 
( 对 于 数据 页 面 )。 对 于 这 1000 行 的 每 一 行 我 们 促 仅 需要 从 表 T1 中 抽取 出 C2 和 CS 来 写 人 IT1， 
大 约 为 8000 字 节 ， 因 此 创建 IT1 和 紧 接 着 的 C2 的 排序 没有 LO 代价 。 对 寺 在 外 表 IT1 中 的 每 一 行 ， 
我 们 设置 T1.C2=K， 然 后 在 对 于 T2.C3= 天 的 C3X 索 下 中 查找 索引 项 ， 对 于 每 --… 个 项 需要 1R 的 
索引 时 LUO ， 代 价 为 1000R 。 

当 我 们 执行 这 个 查找 时 ， 我 们 在 中 间 表 IT2 中 创建 具有 (Tl1.C2, T1.C5, RID ) 形式 的 行 ， 
这 个 表 将 包含 2000 行 ， 每 行 12 字 节 ， 大 约 24 000 字 节 即 六 个 磁盘 页 面 的 缓冲 空间 ， 困 此 我 们 
冉 -- 次 假设 对 填 创 建 IT2 和 根据 RID 什 的 排序 不 需要 LO。 最 后 ， 我 们 扫描 IT2 的 行 ， 使 用 在 IT2 
中 排序 的 RID 值 作为 RID 列 表 的 -一 种 来 检索 来 自 于 内 表 T2 的 行 ， 同 时 用 T2 的 所 有 列 匹 配 T1 的 
C5 和 C2 的 值 来 产生 目标 列表 行 。 我 们 从 T2 中 检索 的 2000 行 极 有 可 能 都 是 在 不 同 的 页 面 上 ， 
WO 代价 为 2000L。 所 以 ， 对 于 此 方法 总 的 VO 代价 为 1000L( 从 Tl 中 抽取 的 行 ) +1000R (C3XX 
的 索引 项 ) + 2000L (从 T2 中 抽取 的 行 )}。 执 行 时 间 为 (1000+2000)/200+ 1000/ 
80=5+10+12.5=27.5 秒 ， 比 例 9.7.3 中 计算 的 崇 套 循环 连接 有 所 改善 ， 而 嵌 套 往 环 连 接 方法 优 于 


归并 连接 。 冯 
和 做 套 循 环 连接 的 优势 来 自 于 这 样 一 个 事实 : 来 犁 于 内 表 的 所 有 行 的 检索 可 以 用 容 有 有 太 数 
据 块 的 列表 预 取 LO 来 执行 。 
4. 多 重 表 连 接 


在 DB2 和 其 他 大 多 数 数 据 库 系统 中 ， 三 个 或 多 个 表 的 连接 通过 同时 连接 两 个 表 被 执行 ; 
前 贤 个 被 连接 的 表 合成 的 结果 被 写 到 一 个 中 间 表 中 去 ， 然 后 同 第 三 个 表 相 连接 。 其 结 时 也许 
同 第 四 个 表 相连 接 ， 全 次 类 推 。 连 接 的 顺序 不 是 由 非 过 程 性 的 SQL 语句 决定 的 ， 而 是 留 给 查 
询 优 化 器 处 理 。 正确 的 选择 是 很 重要 的 。 
涛 虑 三 个 表 连 接 的 形式 : 
[9.7.3] select TiCl, Tl.C2, Te,.C3, T2.t4, To.C5, TH.06, T3.07 
from Tl1, T2, 713 


where Tl.CL = 20 and Tl,C? = T2.C34 and T2.c4 = 40 
and Tz.LS = T3.C6 and T3.C7 = HO: 


对 于 这 样 一 个 连接 的 查询 方案 有 许多 选择 。 我 们 可 以 通过 执行 两 个 连接 T1 mT2 或 T2 MT3 
中 的 -- 个 开始 查询 方案 。 假 设 我 们 以 T] T2 开 始 ， 我 们 可 以 用 一 个 骨 套 循环 连接 或 者 - -个 以 
T1 或 者 T2 作 为 外 表 的 混合 连接 或 者 一 个 归并 连接 (在 归并 连接 中 确定 是 内 表 还 是 外 表 并 不 重 
要 )。 一 旦 表 T4:= Tl1%T2 被 具体 化 了 了 (至少 在 概念 上 }， 我 们 需要 执行 连接 T3%mT4， 可 以 再 
使 用 骨 套 连接 、 混 合 连接 或 者 归并 连接 。 查 询 优 化 器 需要 考虑 所 有 这 样 的 方案 以 发 现 最 有 效 
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的 ， 在 这 里 对 于 查询 优化 器 来 说 有 效 算法 成 为 最 重要 的 。 对 于 涉及 到 多 表 的 连接 ， 查 询 优化 
器 可 以 需要 大 量 的 计算 上 的 努力 。 

注意 ， 在 刚才 提 到 的 方案 中 ， 连 接 T1 和 T2 产 生 T4， 然 后 连接 T4 到 T3 ， 如 果 查 询 优 化 器 决 
定 通 过 一 个 散 套 循环 算法 执行 连接 T4%wT3， 中 间 表 T4:=T1 mT2 在 开始 最 后 连接 步 又 前 不 需 
要 被 具体 化 。 因 为 T4 的 每 一 行 来 源 于 Tl WT2，T4 mT3 的 要 套 连接 的 下 一 个 循环 可 以 立即 执 
行 。 这 种 从 一 个 存 取 方案 的 一 步 的 连续 的 输出 行 可 以 必 为 方案 的 下 一 步 的 输入 的 技术 称 为 流 
水 线 技术 ( pipelining ) 流水 线 技术 使 得 具体 化 所 禹 的 物理 磁盘 空间 最 小 化 。 更 为 重要 的 是 ， 
从 查询 中 只 需要 一 小 部 分 初始 的 行 【 或 许 因 为 用 户 在 看 了 信息 的 几 屏 以 后 ， 停 止 滚 动 光 标 )， 
通过 流水 线 技 术 的 最 小 的 具体 化 总 是 可 以 节省 大 量 的 努力 。 然 而 ， 流 水 线 技术 不 总 是 可 能 的 : 
如 果 查 询 优 化 器 选择 一 个 归并 连接 来 计算 T4=T1 mT2, 然后 另外 - .个 归并 连接 来 计算 T4 mwT3， 
其 中 ，T4 MT3 连 接 列 指定 了 一 个 与 Tl1 四 T2 输 出 的 连接 列 不 同 的 排序 顺序 ， 那 么 在 下 一 个 连 
接 步骤 的 初始 排序 被 执行 前 ,中间 表 T4 必 须 完全 具体 化 。 

5. 杷 瞬 套 和 宾 环 变 撞 为 连接 

把 大 多 数 典 套 查 询 转 换 到 仅 涉 及 表 连 接 的 等 价 查询 是 可 能 的 。 对 于 查询 优化 器 而 言 ， 这 
是 一 种 很 重要 的 技术 。 

例 9.7.5 考虑 查询 


select * from T1 where Cl = 5 
and Ca dn (select C3 from T2 where C4 = 6¢).: 


从 概念 上 讲 ， 我们 考 虚 这 个 查询 可 以 分 两 步 进 行 执 行 。 首 先 ， 计算 子 查 询 ， 对 于 C3 的 选 
择 列 表 抽 取出 值 的 集合 到 一 个 中 间 表 IT1 中 ， 然 后 计算 外 层 查 询 select * from Ti 
where Cl=5 and C2 in IT1L， 在 列 C2 上 的 条 件 是 它 在 刚 产 生 的 IT1 列 表 中 有 一 个 值 、 敌 
这 件 事 的 最 有 效 的 方法 ， 如 果 在 IT1 上 没有 索引 创建 ， 可 能 是 一 个 归并 连接 :， select * 
from IT1L _ where C1=5 被 抽取 到 一 个 中 间 表 了 开 2， 行 以 TlC2 的 值 进行 排序 ， 然 后 ， 图 9-21 
的 归并 连接 过 程 在 IT2 和 IT1 之 间 执 行 。 可 能 的 重复 行 城 在 必须 被 去 除 ， 这 将 在 下 面 解释 。 这 
个 过 程 使 我 们 想起 下 面 一 个 连接 形式 : 


seElect distinct Tl.* from Tli. T2 
where Tl.Cl = 5 and T2,.C4 = 6 and Tl.C2 = T2,c3; 


在 开始 的 子 查 询 和 这 个 连接 查询 给 出 相同 的 结果 ， 并 且 等 价 的 连接 形式 允许 查询 优化 器 使 
用 在 退 春 形式 中 不 是 显而易见 的 其 他 算法 。 例 如 ， 执 行 一 个 以 T2 为 外 表 的 租 套 循环 连接 是 可 
能 的 。 

在 崩 套 查询 转换 到 连接 形式 的 过 程 中 ，DISTINCT 关 键 字 的 需要 来 源 于 下 面 的 观察 ; 如果 
TI1 的 一 行 满足 连接 查询 的 条 件 ， 那么 rl.C1=5， 同 时 在 T2 中 必然 有 一 行 r2 使 得 r2.C4=6 并 且 
rl.C2=r2.C3。 人 是 没有 谈 及 列 C3 和 C4 形 成 了 T2 的 一 个 关系 的 关键 字 ， 因 此 完全 有 可 能 在 T2 
中 还 有 第 二 行 r 3 对 于 C3 和 C4 有 同 :2 相 同 的 值 。 那 么 在 没有 DISTINCT 关 键 字 的 连接 查询 的 选择 
列表 中 ， 行 1 将 出 现 两 次 。 在 该 查询 的 最 初 的 艇 套 形式 中 ， 这 一 点 明显 地 不 会 发 生 ， 因 为 Tl1 
的 每 一 单行 在 概念 上 认为 仅仅 是 一 次 ， 被 谓词 C1=5 和 C2 在 ITi 中 限定 或 者 不 被 限定 。 那 样 ， 
在 连接 形式 中 的 DISTINCT 关 键 字 去 除了 不 会 在 柑 套 形式 中 出 现 的 重复 行 。 | 

像 这 样 的 一 个 变 反 的 价值 在 于 ， 它 减 小 了 查询 优化 器 需要 考 虚 的 不 同类 型 的 谓词 的 数目 
以 获得 优化 的 效率 。 一 旦 例 9.7.5 的 嵌 套 查 海 已 经 被 重 写 为 一 个 等 价 的 连接 查询 ， 它 就 会 演化 
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为 一 个 以 前 已 经 解决 的 问题 ， 并 且 查 询 优 化 禹 可 以 使 用 任何 我 们 已 经 介绍 过 的 连接 方法 。 下 
一 个 例子 考虑 相关 子 查询 的 情况 。 
例 9.7.6 考虑 查询 


sglect * from Tl 
Where Cl = 9 
a C2 Tn lect ta from T2 where C5 = 6 art CH > Tl .tC4Y; 


因为 这 个 嵌 套 形式 包含 了 一 -个 相关 子 查询 ， 在 固定 外 积 的 行 以 使 计算 Tl1.C3 以 前 不 可 能 计 
算 子 查询 。 从 这 方面 考虑 ， 了 唯一 正确 的 方法 似乎 是 : 对 于 Ti 中 的 行进 行 循环 取 值 ，T1 中 的 每 
一 行 找 出 通过 C4 上 的 索引 对 应 的 所 有 T2 中 的 行 ， 其 中 T2.C4 等 于 外 层 的 TiC2z， 然 后 再 解决 条 
件 T2.C6>T1.C3。 现 在 注意 到 上 述 的 构 赛 查询 给 出 与 下 述 连接 查询 相同 的 结果 : 


select distinct Tl.* from Tl, T? 
where Tl.Cl = 5 dnd Ti.t2 = Tagfd and T?.C5 = 6 and T2.c6 > TL .C3: 


对 于 这 种 形式 的 查询 ， 描 绘 它 执行 一 次 合并 连接 的 策略 是 很 容易 的 。 从 T1 中 抽取 出 满足 
条 件 T1.C1=5 的 行 写 人 中 间 表 IT1 中 ， 并 且 按 Tl.C2 排 序 。 然 后 按照 列 C4 对 T2 进 行 排 序 ， 结 果 
放 A 入 I1T2 中 。 现 在 就 可 以 在 TT1.C2 和 T2.C4 的 匹配 值 上 归并 连接 IT1 和 IT2' 排除 重复 值 )， 并 日 
使 行 满足 谓词 条 件 T2.C6>Tj.C3。 这 种 策略 也 许 比 人 能 套 循 环 连 接 要 好 ， 尽 黎 后 者 对 于 以 获 套 形 
式 提出 的 查询 似乎 是 最 卓然 的 。 国 


定理 9.7.1 给 出 了 在 上 述 傅 况 中 的 通用 形式 。 
定理 9.7.1 下 列 两 种 形式 的 查询 给 出 等 价 的 结果 ; 


$elect TIC from Tl where LSet a of predicates on Ti and] 下 之 
1s 1n {select T2.C¢3 from T2 [where Set 日 of predicates on T2，T1]): 


各 


select distirmct Tl.e1 From Tl, Te 
Where Tl.C2 = T2.C3 [and Set A of predicates on T1] 
[and Set B of conditions on T2, T1]; 


注意 到 条 件 中 的 Set A 可 以 为 空 ，Set B 也 一 样 。 请 注意 ， 如 果 来 自 于 访 套 查询 的 Set B 中 
没有 涉及 到 外 层 查 询 中 的 表 T1， 那 么 整个 催 套 查询 是 不 相关 的 。 上 述 给 出 的 形式 可 以 推广 到 
在 外 层 查 询 和 内 层 查 询 中 的 多 个 表 的 情况 。 放 


DB2 只 有 在 一 定 的 条 件 下 才 执 行 这 种 转换 ， 条 件 如 下 : 

1) 子 查询 的 选择 列表 是 一 个 单个 的 列 ， 这 一 点 由 一 个 唯一 索引 具有 唯一 的 值 来 保证 。 

2) 连接 外 层 查询 到 子 查询 的 比较 操作 符 或 者 是 IN 或 者 是 =ANY ( 相 周 含义 加 

因此 ， 所 有 涉及 到 NOT EXISTS 谓 词 的 从 奢 查 询 都 不 会 转换 为 连接 谓词 。 但 是 ， 绝 大 客 数 
从 套 查 询 具 有 等 价 的 连接 形式 ， 如 果 以 连接 形式 提出 的 查询 DB2 查 询 优 化 器 通常 会 找 出 一 个 
更 为 有 效 的 执行 方案 。 这 是 真实 的 ， 尽 管 在 DB2 的 转换 规则 下 转换 成 为 一 个 连接 查询 一 般 是 
不 会 发 生 的 ， 同 时 也 瞳 示 窟 查询 的 人 应 当 尽 可 能 地 建立 连接 形式 的 查询 而 不 是 等 价 的 府 套 形 
六 查询 。 一 旦 使 用 了 府 套 形式 的 查询 ， 可 以 从 EXPLAIN 命 令 的 输出 来 判断 是 否 已 经 执行 了 到 
连接 形式 的 转换 。 一 个 连接 可 以 由 METHOD 列 的 1、2 或 4 的 值 来 说 明 。 
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9.8 磁盘 排序 


在 查 淘 处 埋 中 有 许多 种 情况 ， 在 这 些 情 况 中 ， 对 象 的 集合 太太 以 致 十 不 能 一 次 全 部 都 放 
和 人 内存 进 行 排序 。 回 顾 一 下 ，RID 列 表 被 认为 全 部 放 和 人 RID 池 的 内 存 中 -。 结果 ， 用 于 对 RID 进 
行 排序 的 方法 可 以 是 你 在 数据 结构 编程 课程 中 所 学 的 有 效 的 内 存 排序 算法 的 任何 一 种 ， 比 如 
归并 排序 。 然 而 ， 当 排序 的 对 象 集 合 不 能 完全 放 和 内存 时 .问题 就 会 困难 得 多 。 数 据 库 系统 
需要 使 用 使 磁 丨 TO 人 代价 最 小 的 方法 ， 而 这 个 问题 在 以 前 的 编 穆 课程 中 从 来 没有 旭 及 到 。 我 们 
称 数 据 (其 中 有 一 些 必须 是 常 驻 磁 盘 的 ) 的 一 次 排序 为 磁盘 排序 。 类 似 于 关键 字 查 找 ， 对 于 往 留 
内 存 数 据 的 最 有 效 的 查找 结构 是 平衡 二 叉 树 或 者 2-3 树 ， 而 对 于 磁盘 和 性 留 的 数据 最 有 效 的 结构 
晨 B 树 。 

DB2 在 归并 连接 和 混合 连接 过 程 中 必然 利用 一 个 高 效 的 磁盘 排序 ， 其 中 中 间 表 IT1l 和 IT2 
通过 连接 的 列 或 者 通过 RID 来 排序 。! 除非 一 个 索引 用 来 存 取 已 丝 有 序 的 原始 表 ， 否 则 排 译 是 
必须 执行 的 。) 这 些 表 足够 的 小 可 以 放 作 内 存 ， 但 是 DB2 不 会 内 依靠 这 些 ， 因 此 要 用 到 磁 训 排 
序 。 在 归并 连接 和 混合 连接 过 程 中 使 用 的 磁盘 排序 在 这 些 两 步 连 接 计 划 的 第 二 步 发 生 
(PLANNO=2，METHOD=2 或 者 4 )， 排 序 通 过 方案 表 中 的 两 个 新 的 列 值 来 反映 ， 即 
SORTN_JOIN=Y 和 SORTC_JOIN=Y。 还 有 许多 其 他 的 方案 表 的 列 用 来 表 妆 什么 时 候 溢 盘 排 序 
下 在 被 执行 ， 用 于 何 种 日 的 。 这 些 方 案 列 包括 SORTC_ORDERBY ( 通常 在 Select 语 句 中 使 册 
了 ORDER BY 子 句 时 使 用 )、SORTC_GROUPBY (对 应 于 GROUP BY 子 句 把 项 聚集 起 来 ) 还 
有 SORTC_UNIQ ( 通常 当 在 选择 列表 中 用 一 个 DISTINCT 关 键 字 时 使 用 )。 当 排序 正在 执行 时 ， 
这 些 列 包 含 值 'Y'， 其 他 情况 下 为 'NW'。 注 意 到 在 方案 表 中 有 三 个 列 ， 在 PDB2 目 前 的 版 本 中 从 不 
使 用 ， 所 以 它 的 值 总 是 'N'; 这 些 列 是 SORTN_GROUPBY，SORTNJ_UNIQ 和 
SORTN_ORDERBY。 

N 路 归并 磁盘 排序 算法 

下 面 ， 我 们 谈论 由 茶 个 排序 键 (sortkey) 列 进行 排序 的 行 组 成 的 一 个 炎 。 注 意 拒 们 不 是 必须 
指 一 个 关系 表 ， 而 是 任何 数据 库 系 统 不 能 全 部 放 作 内存 的 记录 结构 对 象 的 列表 。 一 个 磁盘 排 
序 以 一 系列 步 怠 产生 。 在 每 一 步 ， 该 算法 都 向 着 在 磁 绥 上 产生 一 个 有 序 的 结 玉 而 努力 ， 这 个 
过 程 就 是 尽 给 出 与 被 排序 的 表 的 整个 空间 相 比 较 的 内 存 空 间 的 限制 。 如 此 偶 然 地 ， 被 排 夺 的 
表 和 所 有 临时 排序 信息 在 排序 过 程 中 可 以 完全 放 入 内 存 ， 那 么 一 步 就 可以 产生 完整 的 有 序列 
表 。 否 则 ， 第 一 趟 将 表 的 最 大 可 能 部 分 按照 升序 进行 排序 ， 并且 作 为 一 个 有 序 块 写 到 磁盘 ， 
然后 重复 这 个 过 程 直 到 表 中 的 所 有 行 都 被 以 一 系列 有 序 块 的 形式 被 与 到 磁盘 .每 一 个 相 邻 把 N 
个 块 的 连续 归并 到 新 的 、 更 长 的 含有 有 序 行 序列 的 块 中 ， 直 到 所 有 的 行 都 被 排序 为 止 。N 路 归 
并 排序 是 在 数据 结 攀 课程 中 驻 留 内 存 的 两 路 归并 排序 的 推广 以 与 B 树 是 二 叉 树 的 推广 一 样 的 方 
式 。 通过 增加 N, 我 们 可 以 减少 这 样 趟 的 次 数 ， 其 中 每 一 趟 必须 从 磁盘 中 读 出 表 中 所 有 的 信息 ， 
再 把 它们 写 回 磁盘 。 这 样 ，WO 人 代价 需 要 最 小 化 。 

和 项 具 体 一 些 ， 假 设 我 们 有 一 个 由 需要 排序 的 数据 的 得 行 组 成 的 表 ， 和 占有 D 个 磁盘 页 而 
( 我 们 假设 在 磁盘 上 磁盘 页 面 是 连续 的 ， 这 样 就 可 以 用 顺序 预 取 IO )， 同 时 我 们 有 内 存 中 的 
M+1 个 磁盘 缓冲 页 面 ， 其 中 MD， 它 就 是 我 们 在 排序 中 可 以 允许 使 用 的 空间 。 我 们 希 误 演示 
一 个 N 路 归并 排序 的 过 程 。 正 像 我 们 将 看 到 的 ， 如 果 M 衬 D， 我 们 可 以 在 内 存 中 完成 整个 排序 。 
可 以 证 明 ， 行 的 精确 长 度 不 是 很 重要 的 ， 只 要 行 总 是 完全 在 一 个 磁盘 页 面 中 ( 行 不 可 能 跨越 
页 面 )。 为 了 有 一 些 数字 可 以 达到 说 明 的 日 的 ， 让 我 们 假设 D=10 000 页 ，M=2 页 ， 下 而 ,我 们 
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将 执行 一 个 M 路 归并 排序 ， 也 就 是 说 ， 央 为 M=2z， 这 是 两 路 归并 排序 。 下 面 的 所 有 计算 都 可 
以 推广 为 D 和 M 的 任意 值 。 

首先 ， 我 们 说 ， 要 排序 的 行 最 初 存 情 在 称 为 A&1 区 域 的 10 000 个 连续 硫 盘 页 面 中 ， 为 简单 
起 见 ， 假 设 我 们 有 第 二 个 含有 10 000 个 连续 页 面 的 磁 奏 区域， 名 为 A2。 在 归并 排序 的 连续 步 
又 中 ， 把 页 而 从 A1 移 到 A2， 再 反 过 来 。 实 际 上 ， 我 们 并 不 需要 这 么 多 的 空间 ， 介 是 用 这 两 个 
区 域 算法 更 容易 说 明 。 开 始 我 们 假定 行 没 有 里 序 ， 接 着 措 述 M 路 归并 的 第 1 直 。 注 意 ， 在 撞 述 
M 路 归并 的 每 一 不时, 我 们 并 不 考虑 任何 的 顺序 预 取 VO 的 优化 。 最 后 ， 当 考虑 顺序 预 取 WO 时 ， 
我 们 将 描述 更 为 通用 的 N 路 归并 排序 ， 其 中 N<M。 

第 1 幸 ”排序 模块 读 出 要 排序 的 表 的 M 页 的 第 一 块 ， 用 1，2，…，M 表 示 ， 把 它们 从 磁盘 
区 域 A1 读 入 到 内 存 ; 通过 在 一 个 后 面 要 描述 的 方法 在 缓冲 区 内 对 行进 行 排 序 ( 我们 假设 在 排 
序 后 有 序 的 行 可 以 再 放置 在 M 页 上， 以 使 在 页 面 的 边界 上 没有 链 阶 一 一 如 果 所 有 行 都 有 相同 的 
长 度 这 是 很 简单 的 ) ;把 这 M 页 作为 一 个 有 序 的 块 写 到 区 域 A2 的 相应 位 置 . 页 1，2，'…，M。 
这 个 过 程 用 M 真 的 连续 块 重复 (对 于 最 后 一 块 ， 如 果 M 不 能 整除 吕 也许 会 少 一 些 )。 模 块 从 区 
域 A1 中 读 出 编号 为 M x i+1, M xit2, ..., M x i+M 的 页 面 ， 对 这 个 块 中 的 行进 行 排 序 ， 并 且 把 
结果 页 面 写作 到 区 域 A2， 上 岂 B,,。 因 为 已 经 固定 了 值 M=2 ( 一 个 不 大 现实 的 小 数字 ， 只 用 于 说 
明 的 日 的 )， 我 们 可 以 用 下 图 来 勾画 出 第 1 趟 写 人 区 域 Az 的 结果 : 


a 


块 Bo Bi By Ba 虽 4 Bs Re B. Bp wa 


页 被 标号 为 1. 2, 3,…, D -1, D， 它 们 用 块 B。，B,，... 来 编 成 块 ( 两 页 为 一 卖 )， 意 味 着 在 
每 -一块 { 包含 两 页 ) 中 间 所 有 的 行 都 是 处 于 有 序 状态 。 我 们 这 里 假定 D 是 偶数 ,在 区 域 A2 的 
最 后 两 员 D - 1 和 D 分 别 是 奇数 和 偶数 。 如 果 最 后 的 磁盘 页 面 D 是 一 个 奇数 ,那么 最 后 一 个 块 
B ,在 长 度 上 是 单个 的 磁盘 页 面 。 在 第 1 趟 中 ， 我 们 初始 化 了 磁盘 排序 过 程 ， 但 是 后 续 的 步骤 
是 实际 归并 发 生 的 地 方 。 

后 面 的 步骤 ”每 一 个 归并 步 从 最 近 完 成 的 M 块 的 组 中 读 和 最 初 的 负 面 ， 同 时 把 这 些 快 归 
并 到 一 个 更 大 的 块 ， 一 次 把 一 页 写 入 到 不 包含 输入 的 不 同 区 域 的 一 个 新 块 上 上 。 作 为 一 个 例子 ， 
上 述 M=2 的 例子 第 2 把 在 A2 区 域 上 的 第 1 走 的 输出 作为 输入 ， 把 两 个 块 归并 ， 每 个 块 含有 2 页 ， 
同时 把 行 的 有 序 的 结果 写 人 到 在 区 域 A1 上 的 长 度 为 4 抽 的 块 上 。 z 


块 B Bip_1y4 





对 于 这 样 的 归并 仔细 考 虚 它 的 VO 代价 。 归 并 步骤 以 读 人 B, 块 的 第 1 页 和 B; 块 的 第 1 页 作为 
开始 。B, 和 B, 都 是 按照 排序 的 顺序 ， 因 此 显而易见 我 们 只 需要 看 每 一 块 的 第 一 页 以 找 出 包含 
在 两 个 块 中 最 小 的 行 。 事实 上 ,一旦 这 些 初始 的 块 的 页 面 被 污 入 内 存 ， 我 们 可 以 做 的 就 是 在 
每 一 这 样 的 页 面 上 寻找 最 初 的 行 ， 比 较 两 个 排序 键 值 找 出 按照 排序 顺序 排列 的 最 小 行 。 现 在 
我 们 可 以 把 两 个 块 归 并 到 一 -个 更 大 的 输出 块 ， 把 归并 的 行 称 动 到 一 个 有 上 厅 的 在 内 存 中 的 输出 
页面 上 ， 并 且 进 行 必 要 的 磁 檀 读 和 写 。 

在 通常 情况 下 ， 我 们 从 先前 的 趟 中 读 人 来 自 于 M 块 中 的 每 一 块 的 第 1 页 ， 在 每 一 页 上 放置 指 
向 最 初 行 的 游标 。 然 后 ， 我 们 确定 在 任何 游标 下 的 最 小 行 ， 并 且 把 它 放 置 于 缓冲 页 面 的 开始 ， 
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开辟 缓冲 页 面 吓 用 来 放置 排序 输出 的 。( 回顾 一 下 ， 有 M+1 个 缓 神 页 面 可 用 ， 在 需要 轨 并 的 每 一 
块 上 的 每 一 页 面 上 都 需要 一 页 ， 输 出 需要 一 页 。) 在 这 -~ 点 上 ， 必须 要 前 移 游 标 ， 它 指向 的 行 网 
刚 被 归并 到 那 一 块 的 下 一 行 。 如 果 在 当前 页 没有 行 了 ， 我 们 从 剩 下 的 块 中 读 人 下 一 页 。 如 果 在 
那 一 块 中 没有 页 了 ， 我 们 删除 这 个 游标 并 继续 在 剩 下 的 游标 中 归并 列 直 到 所 有 的 行 都 被 归并 。 
当 排 序 的 输出 页 满 时 ， 我 们 把 它 写 人 输出 块 的 下 一 页 上 上 。 在 这 个 过 程 的 最 后 ， 在 M 个 输入 块 中 
的 所 有 行 ， 它 们 的 长 度 为 b 页 ， 已 经 被 归并 成 在 一 个 新 的 含有 M xb 页 的 输出 块 上 排序 序列 。 从 
先前 的 趟 中 ， 我 们 继续 归并 M 块 ， 直 到 所 有 行 已 经 被 归并 成 新 的 更 长 的 块 这样 全 部 步骤 结束 。 
我 们 一 直 执行 后 续 的 步 又 ， 直 到 某 一 站 它 的 输出 块 前 尺寸 超过 D; 在 这 一 点 上 ， 排 序 结束 。 

例 9.8.1 ”两 路 归并 排序 的 例子 ”假定 有 一 个 2000 字 节 行 的 序列 ， 在 每 一 个 磁盘 页 面 上 有 2 
行 ， 按 照 下 面 一 系列 的 键 值 的 顺序 进行 排序 ， 序 列 代表 了 行 的 初始 顺序 。 


S57 22 99 64 1229 4679158 869 17 865 36 3328776546388 095 3844 


经 过 两 路 归并 排序 的 第 1 趟 ， 我 们 有 ( 每 个 两 页 的 块 含 有 4 行 ): 


第 2 趟 后 ， 我 们 有 《 四 页 的 块 ): 


7 了 了 13232229 和 657 64 89 17 283336658656991 | 638445463 77 388 95 


第 3 趟 后 ， 我 们 有 八 页 的 块 ， 最 后 一 个 块 没 有 对 来 归并 ): 


7 1217 22 2829 333846 857 S86465699199 | 638 44546377 8835 


最 后 ， 经 过 第 4 越 ， 我 们 就 有 了 有 序 序列 : 


67121722282903336386 村 想 B45759636465697788919599 
国 


显然 ,在 M 路 归并 排序 的 每 一 未 所 有 的 非 中 止 的 块 都 以 M 因 子 增 长 。 来 日 于 先前 赵 的 块 的 
每 一 页 只 要 读 人 人 一次， 在 产生 这 些 长 抉 的 过 程 中 ， 等 量 数量 的 页 面 被 写 回 伐 稚 。 那 样 ， 秆 1 着 
需要 2D 页 的 1Q， 每 一 个 后 续 的 归并 步 也 需要 2D 页 。 图 9-23 给 出 了 输出 块 尺 十 和 两 路 归并 算法 
的 对 于 后 续 步 又 需要 的 WO， 候 定数 据 有 10 000 页 。 


菇 的 太 小 ”每 一 档 中 的 EO 数 
立 2Z0 000 
20 000 
20 000 
20 000 
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图 9-23 用 两 路 归并 排序 对 于 10 000 页 的 磁盘 排序 步 又 的 序列 
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回顾 -- 下 ， 当 氮 的 尺寸 超出 了 在 表 中 页 而 的 数 旦 ， 表 可 以 成 功 地 被 排序 。 这 意味 着 14 趟 
表 可 以 被 成 功 地 排序 ， 用 了 14 x 20 000=280 000 次 IO。 更 为 普遍 的 ， 经 过 K 趟 ， 我 们 可 以 得 
到 一 个 丑 的 尺 为 2， 当 2* 宇 D 时 ,或 者 换 句 话说 ， 当 K=CEIL(Uog:(D)) 时 ， 我 们 就 完成 了 我 们 
的 排序 。 每 一 趟 仍然 需要 2D 页 的 FHO 代 价 ， 困 此 对 于 一 个 D 真 的 M 路 归并 排序 要 求 的 LO 总 数 是 
2CEIL(OogyD)) x BD, 

作为 一 个 必须 的 IO 的 因 节 ， 从 log(D) 到 logws(D) 的 变化 是 相当 重要 的 。 图 9-24 给 出 了 输出 
上 雇 的 尺寸 和 四 路 归并 算法 连续 趟 间 和 需要 的 TO， 假 设 数据 有 10 000 页 。 图 9-25 给 出 了 - -个 100 路 
归并 排序 对 应 的 数据 。 


归并 [ 附 模 数 块 的 大 小 从 一 未 中 的 WO 数 
1 20 O00 
20 000 
20 O00 


20 O00 
20 000 
20 000 
20 000 





图 9-24 用 四 路 归并 排序 对 10 000 责 伐 盘 排序 步 又 的 顺序 


归并 约 稍 数 此 的 太 沙 和 瞪 一 走 中 的 TO 数 
1 100 20 000 


2 10 000 20 O00 





图 9-25 用 100 路 好 并 排序 对 于 10.000 丰 磁盘 排序 的 步骤 


例 9.8.2 ”一 个 三 路 归并 排序 的 例子 ”给 出 与 前 一 个 例子 相同 的 序列 、 演 示 一 个 二 路 归并 
排序 。 我 们 从 如 下 初始 顺序 开始 : 


57 22 99 64 12 29 46 了 3158 69 17B5 3633 28776546388953844 


经 过 第 1 趟 ， 我 们 有 3 页 的 块 ; 
12 22 29 57 64 99 628 33366577 | 38 4454638895 


经过 第 2 未 ， 我 们 有 : 


经 过 第 3 霄 ， 我 们 得 到 间 两 路 归并 排 席 相 同 的 有 序 硕 太 ， 


6712172228293336384446545758636465 交 77889135939 
Li 


例 9.8.3 ”两 步 方 案 请 求 排序 回 左 例 9.3.6， 其 中 我 们 对 于 prospects 表 使 用 由 以 下 命令 
创建 的 naddrx 索 3|; 


create index naddrx on prospects (2ipeode, city. straddr, namey ， ， 


同时 对 十 这 样 的 查询 需要 找 出 一 个 方案 ( 为 得 到 一 个 排序 在 这 里 有 少 黄 的 修改 ): 
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select name, straddr from prospects 
where zipcode between O2159 and O4158 


order by name, straddr: 

查询 方案 执行 一 个 INDEXONLY 步 又， 其 中 值 从 02159 到 04158 的 zipeede 的 叶子 层 项 的 
范围 使 用 顺序 项 取 来 存 取 ，name 和 =straaar 的 值 被 押 取 出 来 。 息 定 FF (zipcode 
between 02159 and 04158 1) 大 约 是 27100, 抽取 这 些 值 的 索引 扫描 步 皮 需要 存 取 1 百 万 项 ， 
每 项 60 字 节 ，15 000 磁 盘 页 面 ， 因 此 TO 代价 大 约 为 15 0008， 和 需要 15 000/800=18.75 秘 。 

必须 执行 一 个 排序 以 把 输出 (name， straddr ) 行 放 人 到 正确 顺序 的 输出 上 ， 因 此 我 
们 从 寻找 用 于 放置 这 些 行 的 临时 表 IT1 的 长 度 人 手 。 我 们 假定 name 和 stradar 列 各 有 20 字 节 ， 
国 此 行 的 长 度 为 40 字 节 ， 一 页 可 以 容纳 100 行 。 我 们 需要 具体 化 一 个 含有 1 000 000 行 的 表 ， 沉 
要 10 000 磁 盘 页 面 。 

假定 我 们 有 11 块 内 存 组 种 区 页 面 用 来 执行 排序 【一 个 不 现实 的 很 小 的 数 月 ， 只 是 为 了 说 
明 方 便 }。 所 以 我 们 执行 10 路 归并 排序 。 第 1 趟 以 后 ， 我 们 有 尺寸 为 10 的 块 ; 第 2 不 以 后 ， 尺 寸 
为 100; 第 4 趟 以 后 ， 尺 才 为 10 000， 这 样 我 们 便 完成 了 ， 我们 在 执行 块 妇 并 的 VO 中 没有 机 会 
在 IO 中 做 顺序 预 取 LO， 认识 到 这 一 点 很 重要 。 所 以 ， 从 第 1 未 到 第 4 趟 每 一 趟 都 需要 5000 页 
读 和 和 写 ， 总 共 4 x 2 x 5000=40 000R。 最 后 一 趟 不 需要 磁盘 写 ， 因 为 行 现 在 以 正确 的 顺序 返回 
给 用 户 。 我们 将 具体 化 在 缓冲 页 面 中 的 最 后 一 趟 的 行 ， 并 且 尽 锯 地 把 它们 输出 给 用 户 ， 然 后 
重新 分 配 页 面 ， 使 得 最 后 的 -~ 次 写 不 必要 。 所 以 最 后 一 不 的 IO 代价 是 5000R ， 对 于 排序 的 整 
个 VO 人 代价 是 45 000， 需 要 45 000/80=562.5 秘 。 

注意 到 排序 步 她 的 最 后 一 赵 从 来 没有 号 页 的 代价 ， 除 非 后 续 步 缀 需要 一 个 具体 化 的 表 作 
为 输 和 人 人。 更 为 通常 的 情况 是 ， 忽 略 从 一 个 步骤 的 输出 到 另外 一 个 步骤 的 输入 的 ， 不 具体 化 其 
中 的 行 。 在 一 个 排序 的 最 后 一 站， 你 应 当 对 这 个 “ 续 东 游戏 ”高 度 敏感 ， 图 


在 现代 数据 库 系统 中 ， 对 于 一 次 排序 可 歼 得 的 缓冲 页 面 的 数目 足够 上 大， 使 得 其 路 排序 可 
能 是 任何 人 可 看 到 的 最 长 的 一 种 。 我们 可 以 做 一 个 粗略 的 估计 ，100 页 排序 全 部 在 内 存 中 ， 所 
有 其 他 的 排序 在 两 趋 间 发 生 。 


9.9 ”查询 性 能 基准 程序 : 样 例 研究 


软件 基准 程序 是 对 于 测量 方法 集合 的 一 个 规定 ， 用 于 评估 某 种 软件 能 力 ， 通常 是 性 能 。 
一 个 好 的 基准 程序 使 得 管理 员 可 以 完全 基于 性 能 价格 比 来 对 软件 /硬件 平台 做 出 购买 的 决定 。 
另外 ， 如 果 购 买 基 于 其 他 考虑 ， 比 如 现存 系统 的 兼容 性 ， 这 和 时 管理 员 可 以 用 基准 程序 来 确认 
人 性 能 价格 比 不 会 严重 到 使 他 改变 购买 决定 。 对 于 软件 开发 人 员 面 言 ， 基 准 程 序 也 提供 了 一 个 
好 的 质量 确保 测试 ， 使 得 他 们 计划 和 实现 他 们 的 新 产品 来 在 关键 方面 提高 性 能 。 

在 下 面 几 节 提出 的 集合 查询 基准 程序 (Set Query benchmark) 对 于 很 大 范围 的 查询 测量 数据 
库 系统 的 性 能 。 查 询 以 SQL 的 形式 定 尽 ， 也 可 以 以 其 他 查询 语言 实现 ， 同 时 意味 着 可 以 移植 
到 尽 可 能 多 的 平台 。 例如 ，IBM O05/390 大 型 机 的 DB2、Sun Solaris Unix 系 统 的 ORACLE 或 者 
Windows PC 上 的 FoxPro。 这 里 报告 的 测试 结果 来 源 于 运行 于 小 型 IBM 系 列 /390 上 的 DB2 版 本 
2.3 上 的 一 个 基准 程序 。 

我 们 希望 ， 这 些 上 其 体 的 结果 和 由 蕊 们 产生 的 对 于 查询 方案 的 讨论 可 以 使 得 你 对 于 DB2 执 
行 和 查询 的 方法 的 评估 有 一 个 具体 的 认识 ， 而 这 些 仅 通 过 单独 的 理论 论述 是 无 法 获得 的 。 然 而 ， 


rn "» 
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在 下 面 的 元 节 中 将 描述 很 多 细节 ， 而 对 于 这 些 细 节 的 掌握 不 是 很 容易 的 。 为 了 避免 混淆 ， 你 
可 以 细心 地 继续 下 去 ， 一 次 只 看 一 部 分 细节 ， 间 时 做 本 章 后 的 相应 习题 来 对 你 的 理解 做 测试 。 
我 们 已 经 提出 了 所 有 用 于 讨论 的 基本 原理 ， 供 是 为 了 支持 这 些 细节 而 不 断 地 引用 前 面 的 章节 
是 必须 的 . 

重要 提示 “在 本 节 中 司 用 旧 的 磁盘 MO 速度 ”在 本 节 中 ， 我 们 特使 用 在 20 世 纪 90 年 代 初 

的 磁盘 UiDO 过 率 ， 这 是 因为 数据 是 在 那 时 收集 的 ，。 这 些 这 度 值 必 好 是 图 9-10 引 用 这 度 值 

的 一 半 ， 也 就 是 对 于 随 祝 LO 为 0 页 / 秒 ， 对 于 列表 预 取 为 100 页 / 秘 ， 对 于 顺序 IO 为 400 

页 / 秒 。 者 虑 实际 的 执行 时 间 ， 磁 盘 在 页 面 的 存 取 这 度 方面 没 腿 大 进展 。 存 同样 的 时 

期 ， 它 们 的 典型 的 磁盘 存储 能 力 己 经 从 500MB 上 升 到 10GB， 倍 效 是 20。 

回 许 多 不 同 框 染 的 数据 订 性 能 相 比 较 ， 集合 查 询 基 准 程序 其 有 一 种 不 同 的 任务 ， 它 通过 
运用 一 种 简单 统一 的 标准 来 达到 这 种 比较 ， 标 准 就 是 对 每 一 个 平台 用 一 个 简单 的 数据 米 评 售 ; 
每 分 钟 每 一 个 查询 所 花费 的 美元 ($AQPM )。 系 统 的 花费 代表 了 软件 、 重 件 、 还 有 5 年 的 维护 
开销 。 (我 们 总 是 以 每 月 或 每 年 来 计算 软件 和 维护 费用 ， 而 硬件 是 一 次 性 购买 的 。 到 了 5 年 结 
束 时 ， 通 常 认 为 系统 已 经 完全 折旧 ， 而 且 需 要 用 一 个 新 的 、 更 快 的 ， 更 使 家 的 来 普 代 它 。) 在 
系统 的 估算 当中 ， 每 分 钟 的 查询 {QPM ) 是 对 寺 一 个 特定 查询 工作 负荷 (参见 9.1 季 ) 吞 此 兰 的 
-种 度量 ， 它 接收 相同 负荷 的 基准 程序 的 所 有 查询 。 尽 管 看 上 去 这 有 相当 的 局 限 性 ， 一 个 更 
为 复杂 的 方法 也 是 可 能 的 ， 其 中 对 于 一 个 任意 的 工作 负荷 的 QPM 的 估算 可 以 来 自 于 已 公布 的 
详细 的 计时 ， 对 士 每 一 个 单独 的 被 测量 的 查询 而 言 是 基准 程序 要 求 的 。 这 是 一 种 高 度 的 扩展 
能 为 ， 理 论 上 它 允 许 DBA 对 于 其 负责 的 工作 负荷 在 不 同 的 平台 上 的 性 能 进行 比较 。 

在 第 10 章 中 ， 我 们 将 讨论 另外 一 个 不 同 的 基准 程序 ， 被 称 为 TPC-A 基 准 程序 ， 它 测量 数 
据 库 更 新 事务 的 性 能 ; 但 是 现在 我 们 集中 于 DB2 的 查询 性 能 来 完成 我 们 查询 优化 的 内 容 。 

1. BENCH 表 

集合 查询 基准 程序 在 一 个 简单 表 上 完成 它 所 有 的 查询 ， 这 个 表 被 称 为 BENCH {大 鹤 ) 表 ， 
它 被 很 详细 的 规定 使 得 每 一 个 执行 这 个 基准 程序 的 人 都 得 到 相同 的 结果 。 缺 省 的 BENCH 表 包 
含 ] 000 000 行 ， 每 行 200 个 字 节 ， 同 时 含有 行 的 磁盘 页 面 应 当 被 装载 95%。( 在 规范 的 框架 内 
一 个 多 于 1 000 000 行 的 BENCH 表 也 是 可 能 的 ， 但 是 在 接 下 来 的 内 容 中 不 考虑 这 种 情况 。) 为 了 
提供 带 有 过 滤 因 子 范围 的 索引 谓词 ，BENCH 表 具有 13 个 其 有 整形 值 的 索引 列 ， 假 定 每 一 个 值 
的 长 度 为 4 字 节 首先， 我 们 有 KSEQ 列 ， 它 是 - -个 键 列 ， 值 为 1，2，…，1 000 000， 与 装载 
行 的 顺序 相同 。 如 果 KSEQ 是 一 个 完全 的 艇 索引 的 列 ， 那 么 我 们 会 看 到 最 好 的 性 能 ， 意 味 着 行 
按照 KsEo 的 顺序 ， 并 且 行 所 在 的 页 面 碍 磁 失 上 以 连续 的 顺序 险 集 成 块 。 这 通常 可 以 完成 ， 甚 
至 对 于 不 支持 簇 索引 的 数据 库 产 品 ， 它 是 通过 使 用 一 个 新 近 初 始 化 过 的 磁盘 保存 数据 然后 在 
装载 入 行 以 前 以 KSsEQ 的 顺序 对 行进 行 排序 来 实现 的 。 所 有 其 他 的 列 会 有 自然 数值 ， 它 们 的 舍 
雇 它 们 的 和 名字 为 基数 。 人 例如 ， 列 KX2 只 有 值 1 和 2,，K4 县 有 值 1，2，3 和 4。 图 9-25 给 出 了 在 
BENCIH 表 中 所 有 索引 列 的 一 个 列表 。 

注意 出 现在 一 个 列 名 最 后 的 字母 区， 代表 1000 的 倍数 。 这 样 K40K 代 表 从 1 到 40 000 的 值 。 
在 BENCH 表 中 除了 KSEQ 列 的 所 有 其 他 索引 列 在 图 9-26 规 定 的 合适 范围 内 随机 产生 整数 值 。 把 
值 赋 给 列 的 随机 数 产 生 函 数 在 基准 程序 的 规范 中 提供 以 确保 对 二 执行 基准 程序 的 不 间 地 方 得 
到 相同 的 结果 。 当 然 ， 数 字 是 伪 随 机 的 ， 因 为 它们 是 由 一 个 简单 关 数 产生 的 。 然 而 ， 在 效果 
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上 每 一 列 在 适合 的 范围 都 有 随机 的 值 。 参 见 图 9%-27 对 于 BENCH 表 的 前 十 行 的 索引 列 的 一 张 表 。 
这 些 列 的 随机 特性 使 我 们 可 以 对 于 许多 查询 的 结果 给 出 一 个 相对 精确 的 统计 预测 。 例 如 ， 考 
虑 查询 


select countt*) from BENCH Where KS5 = 全; 


| 列 名 ”| 包含 在 该 列 中 的 值 的 范围 


[ET 











列 镍 i 
随 ,2， 

or m0 | 
or pam 00 | 
or ar 
WT 
aa | 
om 0000 | 





图 9-26 基准 表 的 案 引 列 


因为 对 于 K5 有 5 个 不 同 的 值 ， 对 手 谓词 K5=2 的 过 泪 因 子 是 115=0.20， 在 BENCH 表 的 1 000 000 
行 中 ， 我 们 期 望 可 以 搜索 到 接近 200 000 行 的 数据 (实际 搜索 到 的 数目 是 200 637 )。 


on | oom | wor [om or [rm [as Tan Te er Te 
roo | 3309 | e531 | 27 4 | 
se oo 
| ope0 | ors0 | ssn0 | sn | 908 | ons m4 | | or 
oil | ris [ono ee 
eam 7 | 20550 | sa07s | rom2 | ss | Nn | 9 | 4 is 1 
| 0 | som | 86 | ns | m0r | sm | 2 | 201 sll 
| se | ous | i007 | 771 791 wr 1m oi slr 
er [oe | vos ms [0 | | 4s |e | 
0 a | 22709s | 010 [ 2072 | 96 | me 1 1 ss [1] 


图 9-27 BENCH 表 开始 10 行 的 案 引 列 的 值 


13 个 索引 列 的 总 长 度 13 x 4 = 52 字 节 。 为 了 弥补 200 字 节 行 的 另外 148 字 节 BENCH 表 有 8 个 
在 检索 中 从 来 不 用 的 字符 列 : S1 (8 个 字符 )，52 到 S8 (每 个 20 个 字符 )。 当 考虑 到 一 次 表 空 
间 扫 找 的 资源 代价 时 ， 和 避免 非 索引 列 的 查询 的 决定 是 合理 的 ， 这 一 点 我 们 一 会 儿 就 会 看 到 。 

行人 富有 200 个 字 节 的 用 户 信息 ， 但 是 由 于 必要 的 开销 信息 实际 上 会 长 一 些 。 对 于 怡 好 200 
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字 节 长 的 行 ， 我 们 可 以 把 每 20 行 装载 人 .一 页 4KB 的 磁盘 页 面 中 。 对 于 1 000 000 数 据 行 ， 这 需 
层 1 000 000/20 = 50 000 页 。 因 为 额外 的 行 长 上 度 和 页 只 有 95 锡 填 洲 ， 所 以 在 DB2 {版 本 2.3) 中 
只 有 18 行 /页 ， 数 据 页 面 的 数目 为 CEIL (1 000 000/18 ) =55 5S6。 和 参见 图 9-28 中 关于 基准 程序 
的 DB2 统 计 信 息 ， 


基数 (CARD) 页 数 (NPAGES) 
1000000 35 956 


COLCARD INDEX 
NLEAF 
1000000 2080 
432419 2168 
245497 1682 
99996 13093 
40000 1147 
10000 1069 
1000 1033 
100 i1031 
了 5 105 1 
]b 1051 
10$1 
10$1 
1051 





图 9-28 在 DB2 版 本 2.8 中 的 BENCH 表 的 统计 信息 


所 有 索引 也 是 95 免 填 满 ， 每 个 索引 对 应 于 一 个 索引 列 { 没有 串 接 不 同 列 的 索引 )， 索 引 各 
基于 相应 的 列 和 名， 同时 加 上 词 颁 及 ， 这样 ， 列 K100 具 有 索引 K100%X。 具 有 极 太 数 目 重复 值 的 
索引 ， 例 如 K2 到 K100， 具 有 长 度 为 4 字 节 的 索引 项 ， 这 是 因为 DB2 执 行 了 索引 压 盎 。 这 样 我 
们 在 每 一 叶子 页 面 上 可 以 放置 1000 个 项 ( 如 果 页 是 100% 填 满 的 )， 大 约 需 要 1000 个 索引 中 子 页 
面 来 包含 所 有 项 。 在 图 9-28 中 我 们 对 于 每 一 个 索引 的 磁 稚 页面 的 数 日 {NLEAF ) 提供 了 实际 
的 估算 值 。 对 本 其 有 很 少 重 复 值 的 索引 ， 压 绽 是 不 必要 的 ， 有 效 长 度 会 更 大 ， 因 此 需要 更 客 
的 伐 盘 页 面 。 对 于 KSEO 也 许 没 有 压缩 ， 同 时 压 顷 对 于 K500K 也 毫 扰 帮助 ， 因 此 对 于 这 些 索引 
NLEAF 是 最 大 的 ， 

注意 在 图 9-28 中 ， 对 于 每 一 列 的 COLCARD 值 就 是 所 有 小 基数 列 中 期 望 的 值 ， 而 对 于 大 基 
数列 的 值 它 是 有 缺 阶 的 。 例 如,，K500FK 的 COLCARD 值 只 有 432 419， 比 500 000 这 个 值 沙 许 多 。 
如 果 我 们 考虑 列 值 是 随机 产生 的 ， 并 且 想 像 一 下 把 1 000 000 支 标枪 投向 500 000 个 空位 时 的 情 
景 ,那么 对 于 上 述 情 况 产 生 的 原因 就 会 显而易见 了 。 根 据 公式 [8.6.4]， 击 中 空位 的 期 望 值 是 : 

MI(l ~ e™™)=50 000(1 ~ e’) 

用 计算 器 来 计算 这 个 公式 ， 我 们 可 以 得 到 432 332， 接 近 于 观察 到 的 实际 值 。 

2. 装载 时 间 测 量 

下 面 介 绍 的 测量 值 是 运行 于 IBM 9221 型 170 主 机 上 的 DB2 版 本 2.3 的 结果 ， 它 有 1200 个 
4KB 内 存 缓冲 区 页 面 《 基 准 程序 要 求 的 缓冲 空间 )， 还 上 有 两 个 3390 磁 盘 驱 动 器 (可 以 允许 任何 
数 自 ， 但 是 最 有 效 的 是 一 个 用 于 数据 页 面 而 另 一 个 用 于 索引 )。 

图 9-29 是 装载 BENCH 表 和 执行 RUNSTATS 以 收集 统计 信息 的 执行 时 间 和 CPU 时 间 ， 还 有 
答 纳 表 和 索引 需要 的 磁盘 存 情 空 间 。 
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执行 时 间 ( 种 ?) CPU 时 间 介 所 酸 生 空间 !MB) 


装 坊 10 170 3186 


RUNSTATS 5082 1535 
所 用 的 磁盘 空间 





图 9-29 基准 程序 装载 时 间 测 量 ，DB2 版 本 2.3，1IBM9221 雪 170 主机 


9.10 查询 性 能 测量 


在 这 一 并 ， 我 们 通过 运行 怀 注 为 Qi，Q2A，Q2B，Q3A，Q3B、Q4A，Q4B ，Q5，Q6A， 
和 Q6B 的 一 系列 查询 来 提供 测试 结果 。 我 们 再 一 次 提醒 你 应 当 细 心 ， 一 次 只 看 一 段 细 节 。 每 
-组 查询 通常 包括 单个 SQL 查询 形式 的 一 套 测 试 ， 通 过 谓词 的 变化 来 使 用 不 同 的 索引 列 和 提 
殿 不 同 的 过 滤 因 子 。( 请 看 例子 ， 图 9-30 是 查询 QI 的 结果 。)] 像 Q2A 利 Q2B 这 样 一 对 查询 指 近 


似 但 允 咯 有 不 同 的 SQL 查询 形式 。 
诈 圾 珊 取 
Eo 


织 生 时间 Cpu 获取 负面 上 随机 LO 觅 序 陨 地 

宇 

oo om | 
07 


EE EE i 
4 
2 
2 
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图 9-30 Q1 测 量 


对 于 每 一 个 被 测量 的 查询 ， 我 们 都 提供 以 秒 为 单位 的 执行 时 间 【 那 就 是 ， 等 待 响应 的 挂 
辟 钟 的 时 间 )、 以 称 为 单位 的 CPU 时 间 、 请 求 的 页 的 总 数 ， 分 解 为 随机 IO 、 顺 序 巴 取 L1O 还 有 
列表 预 取 IO 的 次 数 。( 这 些 [O 中 的 任意 两 个 可 以 为 0。) 这 些 数据 可 以 从 DB2PM 产 品 LDB2 性 
能 监视 器 ) 中 的 一 个 标准 的 MVYS 日 志 程序 中 获得 ， 在 9.11 节 中 会 分 别 讨论 它 的 用 户 许 可 和 价 
格 。 表 中 列 出 的 随机 MO 在 PH2PM 报 告 中 标明 为 同步 《sync ) HO。 注 意 ， 这 里 的 所 有 查询 都 
是 以 时 人 式 SQL 语 句 在 程序 中 提 变 ， 这 样 你 束 会 看 到 执行 对 间 和 CPU 的 时 间 都 要 略 小 于 直接 
从 标准 用 户 界面 (SPUF] ) 提交 的 即席 查询 。 为 了 使 TO 测量 保持 一 致 性 ， 我 们 在 每 一 个 查询 
组 执行 前 都 会 刷新 内 存 ， 使 得 存 取 的 磁盘 页 面 不 可 能 已 经 党 驻 内 存 。 刷 新 内 存 的 过 程 就 是 执 
行 一 个 和 不同 的 很 长 的 查询 ， 尽 管 在 实际 使 用 中 很 小 的 重要 也 是 可 能 的 。 我 们 将 一 边 叙 述 … 边 
依据 来 自 于 DB2 的 EXPLAIN 结 果 说 明 每 一 个 查询 的 结果 。 
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1. 1 查询 
QQ1 查 询 具 有 如 下 形式 ， 


Fer edth KN ee (ESEQ, KIOOK, 2 ， » Ke2]} 
seEleECt count{*} from BENCH where KN = 2 


驶 像 在 Select 语 句 前 的 集合 符号 表明 的 那样 ， 符 号 KN 代表 任何 -个 索引 列 KSEQ， 
K100K,， -.-，K4，K2。 这 种 情况 中 的 每 一 个 都 代表 了 一 个 查询 .它们 的 测量 结果 在 图 9-30 
中 ， 它 们 共同 组 成 了 Q1 查 询 组 。 

注意 ，Q1 是 在 文本 检索 的 早期 应 用 中 一 -个 典型 的 查询 。( 参见 例 3.10.7)。-- 个 用 户 要 
查 词 在 摘要 中 出 现 特 定 关键 字 的 所 有 已 出 版 的 期 刊 中 的 文章 ， 他 也 许 首 先 查询 有 和 多少 文 章 
包含 这 个 关键 字 ,然后 再 进 - -… 步 精炼 查询 直到 文章 的 数目 足够 少 ， 使 他 可 以 检索 每 .篇 文 
章 的 全 部 摘要 。 显 然 ， 关键 字 的 过 滤 因 子 也 许 变 化 剧烈 ， 而 且 从 一 个 关键 字 到 另外 一 个 也 
许 个 可 预料 ( 如 关键 字 ='experiment%' 同 关键 字 ='ruthenium' }， 这 个 动机 对 十 不 同 的 列 的 基 
数 有 KN 范围 。 

应 用 于 Q1 组 中 的 所 有 查询 的 EXPLAIN 命 令 表明 ， 我们 可 以 使 用 合适 的 KN 索引 (例如 ， 看 
KN 代表 K100 的 情况 下 ，ACCESSTYPE=I，ACCESSNAME=K100X )， 同 时 查询 可 以 在 不 依 师 
于 数据 ( INDEXONLY=Y ) 的 情况 下 完全 解决 。 那 么 在 图 9-30 的 最 上 面 - 行 ， 其 中 KN 代表 
KSEQ【 我 们 在 下 面 以 KN 三 KSFQ 来 表示 )， 我 们 看 到 存 取 KSEQX 索 引 的 三 层 直 到 看 叶子 层 的 唯 
一 项 需要 执行 二 次 随机 LO。 回 顾 一 下 内 存 已 被 刷新 ， 因 此 通常 执行 最 大 数目 的 11O 次 数 。 

在 具有 重复 值 的 情况 下 ， 滑 词 KN=2 在 索引 中 是 这 样 解决 的 ， 先 在 适合 的 索引 叶子 层 中 走 
到 最 左边 的 值 为 2 的 地 方 ， 然 后 从 左 到 右前 进 直到 没有 项 值 为 2 为 止 。 对 于 谓词 K100K-2， 这 
意味 者 要 大 约 遍 历 10 个 项 ; 对 于 XK10K， 是 100 个 项 ， 等 等 。( 在 附录 户 中 给 出 了 在 集合 查询 基 
准 程序 中 大 多 数 查询 检索 到 的 行 的 精确 数目 . ) 因为 对 于 每 一 叶子 页 面 面 言 有 大约 1000 个 项 ， 
对 于 财 才 谈 到 的 两 个 谓词 我 们 不 期 望 有 多 于 3 次 的 WO (叶子 屋 的 毅 亡 也 许 不 必 跨 越 页 面 )， 对 
子 K1K=2 也 许 需 要 4 次 ， 其 中 有 1000 个 项 {遍历 实际 上 确保 从 一 叶子 页 到 另外 一 页 )。 对 于 请 
词 K2=2， 我 们 期 望 在 叶子 层 太 约 遍历 500 000 个 项 ， 这 意味 着 有 526 叶 子 页 面 ， 成 者 对 于 K2X 
索引 是 NLEAF 值 的 一 半 ( 参见 图 9-28 )。 我 们 从 获取 页 ( Get Page ) 请 求 的 数目 可 以 看 到 
G=528， 了 就 是 存 取 了 526 个 叶子 页 面 和 2 页 额外 的 索引 页 面 。 我 们 也 可 以 看 到 执行 了 上 18 次 顺序 
预 取 IO 和 48 次 随机 IO。 我 们 可 以 把 通过 预 取 存 取 的 页 面 的 总 数 的 计算 为 (528 - 48 ) =480， 
每 一 次 预 取 读 人 的 页 面 的 平均 数目 为 (480 ) /18=26.7。 注 意 到 DB2 对 于 每 26.7 页 使 用 18 次 顺 
上 厅 观 取 WO， 而 不 是 最 大 的 32 页 的 预 取 次 数 。 这 一 点 的 原因 主要 是 技术 上 上 的， 并且 对 此 兴趣 不 
大 ， 但 是 要 注意 到 这 种 类 型 的 得 预 取 的 IO 出 现在 Q1 测 量 的 几 行 上 。 

对 于 更 长 的 查询 大 铬 数 的 执行 时 间 消 耗 在 CPU 上 面 ， 而 不 是 LO 的 等 待 时 间 。 用 我 们 的 经 
验 规 则 ， 我 们 可 以 天 致 计 算出 LO 的 执行 时 间 。 在 K2 的 情况 下 ， 在 每 秒 400S 的 速度 下 480S 需 
要 1.2 秒 ， 以 每 秒 40R 的 速度 48R 需 要 1.2 秒 ， 因 此 总 的 执行 时 间 为 2.40 秒 。 加 上 CPU 的 6.17 秒 ， 
我 们 得 到 8.57 各 的 执行 时 间 。 因 为 执行 时 间 只 有 7.73 秒 ， 我 们 推断 部 分 11O 的 时 间 同 CPU 的 时 
间 是 重 秋 的 ， 我 们 在 接 下 来 的 查询 中 将 会 看 到 这 是 一 个 完全 合理 的 结果 。CPU 时 间 的 测 址 可 
以 由 一 个 毅 历 叶子 层 项 数目 的 一 个 线性 明 数 来 预测 。 如 果 预 测 的 CPUBJ 间 表示 为 T， 遍历 的 项 
的 数目 为 N， 那 么 我 们 可 以 与 为 : 


T =00000122H + 0.07 
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这 个 线性 形式 在 测量 的 整个 范围 内 最 大 的 误差 为 0.05 种 。 这 里 ， 常 数 0.07 秒 代表 -个 相对 
稳定 的 起 始 代 价 ， 常 数 0.0000122 秘 代表 处 理 每 个 叶子 层 项 必须 的 时 间 ， 其 中 没有 计算 LO 的 
开销 和 其 他 不 重要 的 操作 的 和 开销。 如 果 有 一 个 6.SMHEPS 的 CPU， 对 于 每 一 个 项 执行 的 实际 的 指 
令 数 是 (6 500 000 ) (0.0000122)=79， 相 对 于 以 前 的 版 本 有 了 很 天 提高 ， 但 是 当 我 们 考虑 到 
所 有 正在 被 做 的 是 计算 一 个 长 的 列表 中 连续 的 项 时 ， 这 个 时 间 仍 然 有 些 大 。 存 在 者 一 个 更 为 
有 效 的 计算 方法 ; 最 初 的 集合 查询 论文 测试 了 一 个 称 为 MODEL 204 的 数据 库 产 品 的 性 能 ， 它 
可 以 以 20 至 30 信 的 高 效 来 执行 Q91 查 询 。 但 是 ， 大 多 数 数据 库 产品 在 CPU 方 面 都 不 会 像 DB2 这 
么 高 效 。 

2. QQ2A 查 询 

Q2A 查 询 具 有 如 下 形式 : 

For each KN e {KSEQ, KIOGK, 2 . . .KK#} 


select Countf yy from BENCH Where K2 = 2 and KN = 3; 


测量 结果 加 图 9-31a 所 示 。 


执行 时 间 | CPU8 | 获取 页 面 和 顺序 矛 撒 | 列表 预 取 
(by 间 十 入 请 求 TO 次 数 BO 次 数 









ch rom] wl | 
Er EA I EC EE 
el ov] ly | 
an | a er | 7 
人 aa 
5 
la | | or | | 
a |i [am [ss | 56 





图 9-31a Q2A 测 量 


O2A 是 另外 一 个 在 文本 检索 应 用 中 的 典型 查询 ， 它 是 带 有 两 个 特性 的 杂志 文章 的 搜索 ， 
其 中 一 个 特性 是 低 的 过 滤 因 子 〔 日 期 >'65/01/31' 关键 字 ='plutonium' )。Q2A 查 询 也 可 以 应 用 于 
市 场 调 查 来 估算 具有 一 对 给 定性 质 的 候选 者 的 数 日 (如 gender="M'，hobby='tennis' )。 这 种 
的 查询 类 型 包括 在 基准 程序 之 中 的 原因 之 一 是 : 可 以 用 它 来 测量 从 两 个 不 相关 的 索引 中 合并 
RID 列 表 时 数据 库 产 品 的 性 能 如 何 。 就 像 我 们 已 经 学 过 的 ，DB2 产 品 具 有 通过 利用 在 9.6 节 中 
的 MX 类 型 方案 来 合并 这 样 的 RID 列 表 的 能 力 。 合 并 了 这 两 个 索引 以 后 ， 没 有 必要 再 存 取 数据 
行 ， 国 为 选择 列表 仅 和 包含 一 个 countf ) 医 数 ， 而 这 个 函数 可 以 通过 计算 最 终 的 RID 列 表 来 宛 成 。 

然而 ， 对 于 这 组 查询 的 EXPLAIN 命 令 表 明 : 从 来 都 不 会 用 -- 个 MX 方案 ， 原 因 是 很 明显 
的 。 回 顾 一 下 ， 单 个 RID 列 表 仅仅 用 了 RID 字 的 50 吕 ， 而 RID 池 的 空间 是 人 磁盘 缓冲 池 的 一 半 。 
因为 基准 程序 允许 的 伐 盘 缓冲 池 中 有 1200 页 ，RID 池 含有 600 页 空间 ， 即 天 约 2400KB 。 现 在 
考虑 谓词 Kk2=2。 我 们 希望 找到 满足 这 个 请 词 的 500 000 行 ， 并 且 500 000 个 RID 占 用 2000KB， 
得 一 个 占 4 个 字 季 一 一 多 于 RID 字 的 2400KB 的 50%。 所 以 在 一 个 MX 类 型 的 方案 中 不 能 得 到 谢 
词 K2 =2 的 结果 ， 因 此 必须 使 用 其 他 方案 . 
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对 于 Q2A 组 的 EXPLAIN 命 令 显示 DB2 对 于 不 同 的 查询 采用 两 种 不 同 的 方案 。 在 KN 不 代表 
K4《KN 天 K4) 时 ，DB2 在 一 个 匹配 索引 扫描 中 ( ACCESSTYPE=1) 使 用 带 有 更 小 的 过 滤 因 
子 的 谓词 (KN=3 ) 来 检索 数据 中 的 行 ， 然 后 测试 每 -… 行 以 解决 其 余 的 谓词 ， 计 算 满 足 两 个 条 
件 的 行 。 然 而 ,在 KN 三 K4 情 况 下 ， 我们 需要 使 用 -一 次 表 空 间 扫 描 ( ACCESSTYPE=R ) 来 解 
决 查询 。 在 图 9-31a 的 最 后 一 行 中 KN 二 K4, 我 们 可 以 看 到 执行 了 1737 次 顺序 预 取 LO 和 56 次 随机 
IO。 读 的 页 面 的 总 数 为 55 559 页 (注意 在 图 9-28 中 ，NPAGES=55 556 )， 须 序 质 取 11O 读 
(55 559-56 ) =55 503 页 ， 我 们 可 以 计算 出 每 一 顺序 预 取 为 55 50811737=32 页 。 我 们 的 经 验 规 
则 表明 ， 对 于 55 503S 所 需要 的 执行 时 间 是 55 503/400=138.76 秒 ，56R 读 加 人 相对 不 重要 的 1.4 
秘 。 显 热 ， 与 测试 的 133.27 秒 时 间 相 比 ， 这 个 结果 稍微 超过 了 5 名， 即 138.76+1.4=]140.16 秘 .。 
我 们 认为 在 这 个 受 WO 限 制 严 格 的 查询 中 CPU 的 26.90 种 与 WO 的 时 间 完 全 重 营 。 

现在 考虑 其 他 随机 产生 的 六 在 Q2A 杏 询 组 中 被 引用 的 列 上 的 谓词 KN=3， 其 中 ,KNE 
{Kl1OOK,， KlIOK，KlK，K100，K25，K10，K5})。 图 9-31a 相 应 行 的 随机 LO 和 有 和 肘 序 预 取 LO 
的 测量 对 应 于 扫描 适宜 索引 的 资源 ， 而 及 同 Q1 的 INDEXONLY 测 量 很 相似 。( 例如 ， 在 图 9- 
31a 中 计算 谓词 K5=3 的 资源 是 8 次 顺序 预 取 WO 和 61 次 随机 WO。 在 图 9-30 中 ， 计 算 谓 词 K5=2 的 
索引 LO 资源 是 9 次 顺序 预 取 IO 和 46 次 随机 MO. ) 在 图 9-31a 中 出 现 的 列表 需 取 TO 单独 地 用 作 
仓 取 需 要 的 行 。 在 K100K=3 的 情况 下 ， 大 约 有 10 行 被 检索 到 一 一 有 可 能 在 分 获 的 磁盘 页 面 上 
一 一 只 有 一 次 列表 预 取 LO。 一 次 刻 表 预 取 LHO 可 以 存 取 最 案 32 页 ， 但 是 在 这 种 情况 下 ， 它 只 能 
存 取 10 页 。 类 伏地 ， 在 K10K=3 的 情况 下 ， 天 约 有 100 行 被 检索 到 -- 一 可 能 在 100 个 不 同 的 磁 盟 
页 和 面 上 一 一 需要 4 次 列表 预 取 LJO。 考 上 起 在 K100=3 的 情况 。 检 索 到 的 行 数 大 约 为 10 000。 为 了 
看 到 检索 到 的 磁盘 页 面 的 数 起 ， 我 们 可 以 将 其 看 做 10 000 支 飞镖 随 机 投入 55 556 个 磁盘 页 而 中 
的 问题 ， 问 时 间 有 刻 少 页 面 被 击 中 了 。 会 式 [8.6.4] 给 出 : 

E( 被 击 中 的 页 面 的 个 数 )=MI1 -ey)=55 556(] -e9152 

现存 计算 要 拾取 9 196 磁 盘 页 面 时 的 列表 预 取 WO 次 数 ， 我们 得 到 CEIL(9 152732)=286， 很 
接近 于 执行 287 次 列表 预 取 JO。 

MX 类 型 方案 不 能 用 于 这 个 查询 组 ， 这 个 事实 屁 一 个 严重 的 问题 。 我 们 可 以 组 合 索 引 不 必 
到 达 数 据 ， 对 于 Q2A 最 大 的 执行 时 间 也 许可 也 与 Q1 的 对 于 K2 的 时 间 加 上 在 Qi 中 取出 KN 的 RID 
列表 的 时 间 进 行 比 较 ， 最 大 不 会 超过 20 秒 。 但 是 ， 我 们 看 到 的 却 基 很 长 的 执行 时 间 。 注 意 在 
大 多 数 情 况 下 ，DB2 有 足够 的 RID 池 空间 来 候 理 Q2A 查 询 (最 后 一 种 情况 也 许 不 适合 }， 但 是 
一 条 不 灵活 的 规则 使 得 它 无 法 利用 这 种 优势 . 这 不 是 我 们 从 一 个 查询 优化 器 期 望 的 行为 。 
DB2 仍 然 有 很 多 灵活 性 ， 从 这 里 我 们 可 以 得 到 的 一 个 教训 是 : DBA 应 当 总 是 计划 一 个 尽 呆 能 
大 的 缓冲 池 ， 而 及 ， 如 果 有 必要 订购 天 一 些 的 内 存 。 

3. 中 2B 查 询 

Q2B 查 询 具 有 如 下 形式 : 


For each KN e {KSEQ, KIOOK, ， . 。 ， K4} 
select countt*y from BENCH Where K2 = 2 and net KN 一 3; 


对 于 这 个 查询 组 的 测量 ， 参 见 图 9-31b。 

Q2B 是 Q2A 的 -个 变型 ， 而 它 是 一 群 商 业 用 户 最 初 对 集合 查询 基准 程序 进行 测试 时 提出 
的 。 它 代表 了 一 种 查询 类 型 ， 而 这 种 类 型 可 以 找 出 在 它 被 高 效 执行 的 情况 下 的 用 法 ( 204 型 用 
户 通 常 可 以 在 小 二 1 秘 的 情况 下 得 到 对 于 这 个 查询 的 -一 个 响应 }。 在 DB2 的 情况 下 ， 很 多 问题 
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来 自 于 高 效 的 索引 的 使 用 。 我 们 想 要 看 到 查询 优化 器 执行 一 次 非 匹配 索引 扫描 以 得 到 对 于 谓 
词 not KN=3 的 一 个 RD 列表， 然后 用 请 说 k2=2 执 行 MX 过 程 ， 这 样 就 可 以 避免 存 取 所 有 的 表 
中 的 行 。 但 是 ,我 们 不 能 够 抽取 对 于 K2=2 的 RID 列 表 ， 就 像 我 们 在 Q2A 中 讨论 的 那样 ， 这 是 
因为 RID 池 大 小 的 限制 ， 即 使 在 RID 池 上 没有 限制 ， 男 外 一 个 因素 排除 了 MX 媒 理 ， 尖 为 DB2 
不 会 执行 一 个 在 XN 上 的 非 匹 配 索引 扫描 来 抽取 一 个 RID 列 表 (定义 9.6.1 的 RID 池 规则 2 )。 排 
除了 KN 索引 ， 在 谓词 Kk2=2.|. 的 一 个 简单 索引 扫描 没有 足够 的 过 滤 力 晤 来 除去 考虑 中 的 任何 磁 
盘 页 面 (每 真有 17 行 )， 因 此 查询 优化 器 对 于 Q28B 组 的 所 有 查询 选择 一 次 表 空 间 扫描 。 测 量 绪 


果 可 以 同 Q2A 的 K4 行 进行 比较 。 
获取 上 见面 | 随机 LO 顺序 预 限 
请 求 次 数 MO 次 数 
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图 9-31b Q2B 测 县 





4. 03A 查 询 
虽 3 友 查询 有 具有 如 下 形式 : 


For each KN e LKLOORE, KIDRE, Kl1OGO, K25, KlO, KB kd} 
selgct sumCKLKY from BENCH 
Where ¢SEQ between 400000 and SOOOOD and KN = 3; 


图 9-32a 包 含 了 这 个 查 调 组 的 测量 。 


执行 时 间 | CPU 时 
(种 ) 间 ( 秘 ) 


184 





图 9-32a 3A 测 县 
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Q3A 但 询 创建 来 为 一 个 直接 的 市 场 类 型 的 应 用 建 模 ，prospects 表 中 在 邮政 编 公 范围 内 
(在 .个 给 定 的 地理 区 域 ) 并 且 具 有 其 他 某 些 特性 (hobby='tennis' ) 的 行 必须 被 很 详细 地 检 
查 ， 直 到 现在 为 止 ， 所 有 考虑 的 查询 都 是 仅仅 通过 检查 索引 信息 来 取得 满足 条 件 的 结果 .【 玉 
管 DB2 中 的 规则 使 得 在 Q2A 和 Q2B 中 这 样 做 不 可 能 ，204 型 可 以 只 用 党 引 满足 这 些 查 测 ， 问 时 
响应 的 时 间 更 快 )。 然 调 ， 在 Q3A 的 情况 下 ,集合 函数 sum(K1K) 不 能 够 在 索引 中 满足 ， 因 为 
K1K 的 值 不 会 出 现 于 在 WHERE 子 名 中 的 任何 索引 中 。( 注意 ， 图 9-32a 对 于 KN 三 K1kK 没 有 项 ， 
因此 INDEXONLY 情 况 被 避免 了 。) 所 以 ， 为 了 把 E1FK 的 值 加 起 米 ， 我 们 必须 存 取 选 择 的 行 。 
尽管 Q3A 查 询 仅 仅 检 索 一 个 集合 熙 数 的 值 ， 但 是 它 微 了 -个 从 每 一 行 检索 一 个 列 值 的 查 向 的 
大 部 分 了 上 作 。 

EXPLAIN 命 令 表 明 : 在 执行 这 个 查 章 组 时 有 两 种 不 同类 型 的 查 章 方案 ， 对 于 KN 三 K100FK 
和 KN==K10K， 匹 配 索 引 扫 描 是 分 别 在 K100K 和 K10K 上 执行 的 ， 并 册 对 了 于 检索 到 的 行 KSEQ 上 
证 词 被 测试 。 图 9-32a 中 ， 随 机 LO 用 来 检索 索引 项 ， 列 表 预 取 WO 用 来 检索 行 ， 在 Kl100K 情 况 
下 一 次 预 取 大 约 为 10 行 ， 在 K10K 情 况 下 4 个 预 取 为 100 行 。 已 经 证 明 ， 人 恒 用 随机 TO 可 以 和 最 多 
检索 到 100 行 ， 执 行 多 重 索引 存 肥 没有 获得 什么 好 处 ， 从 KSEG 抽 取 一 个 RID 列 表 以 存储 - 些 存 
到 的 行 一 一 我 们 己 经 钊 达 了 9.5 节 中 看 到 的 减少 返回 点 。 

对 于 小 基数 的 列 ，KNe {K100， K25， K10，K5，，K4}，KSEQ 上 的 BETWEEN 请 词 用 
在 一 次 匹配 索引 扫描 中 ， 对 于 检索 到 的 行 测试 RN 上 的 谓词 。 对 于 这 些 情况 的 每 一 种 ， 图 9-32a 
表明 读 人 了 5778 页 。 这 些 页 和 耐 中 大 部 分 代表 了 索引 叶子 页 面 的 大 约 10 免 和 计算 谓词 between 
400000 ang 500000 的 数据 页 面 的 10%， 这 样 ， 我 们 可 以 从 图 9-28 的 统计 信息 计算 为 
NLEAPF/10+NPAGES/10=208+5556=5764 页 。 我 们 看 到 ， 用 184 个 顺序 项 取 IiO 来 检索 5778- 
200=5578 页 (在 KN 三 KEK100 情 况 下 ， 对 于 小 基数 列 的 相对 典型 的 UO 使 用 )、 这 意味 着 读 人 顺序 
预 取 LO 的 页 面 的 平均 数目 为 30.3 页 。 

在 这 个 查询 组 中 DB2 的 性 能 极 好 ， 比 204 型 和 其 他 当前 的 产品 郁 疲 好 出 许多 ， 这 是 内 为 已 
成 为 DB? 技 巧 包 的 一 部 分 的 独特 的 预 取 LA 能力， 这 由 智能 磁盘 控制 璐 辅助 。 

5.Q3B 查 询 

Q3B 查 询 上 共有 如 下 形式 : 

For each KN e (KIOOK, KIOK, KlOO,. K25, KlO, KS, E41 

select sumtKkliK}y from BENCH 
ashere (KSEDO between #0000 and 410000 
or KSEQ between #420000 and 430000 
or KSED between 440000 and 450000 
or KSEQ betweern 460000 and #70000 


or KSEQ between #80000 and S00000}) 
and KN = 3; 


图 9-32b 列 出 了 这 种 查询 的 测量 。 

Q3B 查 询 是 Q3A 查 淘 的 .一 个 变型 ， 主 要 是 基于 直接 市 场 应 用 的 经 验 表明 在 一 个 给 自 的 地 
理 区 域 中 候选 者 不 必 蒂 在 单个 的 邮编 范围 中 ， 而 可 能 是 不 同 范围 的 并 。 除 此 之 外 ， 这 种 查询 
评估 查询 优化 器 的 高 级 性 能 的 一 种 很 好 的 查询 。 注 意 ， 在 这 个 查 放 中 由 DR 来 连接 的 
BETwEEN 谓 词 一 起 构成 了 在 Q3A 中 覆盖 的 单个 范围 的 60 呈 (RSEO 范 围 和 泥 猎 数据 范围 的 总 


数 的 6 小 
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【种 ) 各 (fb) UO 次 数 LO 次 数 
EE 一 十 一 
如 十 生 十 让 | 二 二 十 二 十 二 
os oe | | Hm | 7 | 
NE ED ET EE CE 
1 7 | | 50 | 250 
oe 777 ssl st30 | 235 


图 9-32bh QQ3B 测 旺 


EXPLAIN 命 令 显 示 ， 执 行 Q3B 查 询 组 使 用 了 三 种 不 同 的 查询 方案 。 就 像 在 Q3A 中 一 样 ， 当 
KN 三 K100K 或 KN 三 KI10K 时 ， 一 次 匹配 索 3| 扫 措 分 别 在 K100K 和 Kl10K 上 执行 ， 并 且 对 于 检索 到 
的 行 KSEQ 上 的 谓 启 被 进行 测试 以 确定 这 些 行 中 的 一 个 是 否 满 足 要 求 。 对 于 这 些 情 况 的 测量 十 分 
类 伺 于 Q3A 的 情况 。 对 于 两 个 最 小 基数 的 列 KXN=K5 和 KN=K4，EXPLAIN 表 明了 带 有 
ACCESSTYPE=I，ACCESSNAME=KSEQX 和 MATCHCOLS=0 的 一 个 方案 ; 换 句 话说 ， 在 KSEC 
上 的 一 次 非 匹 配 索 引 扫 撕 。 接 着 要 发 生 的 是 检查 从 400 000 到 300 000 范 围 内 的 KSEQ 索 引 值 ， 对 
于 每 一 个 值 K SsEQ 谓 词 被 测试 以 确定 它们 中 的 一 个 满足 条 件 。 对 于 结果 RID， 来 源 于 基准 
(BENCH ) 表 的 行 被 读 入 (使 用 顺序 预 取 WO， 因 为 数据 由 KSEQ 守 艇 )， 剩 下 的 KN=3 谓 词 被 测试 。 
我 们 可 以 看 到 在 本 查询 中 使 用 比 Q3A 结 果 更 海 少 的 顺序 预 取 WO 的 数目 ， 这 基因 为 检索 到 更 少 的 
行 。 在 Q3B 中 减少 的 数目 比 Q3A 超 过 了 60%， 这 个 事实 没有 被 完全 解释 注意， 在 这 两 种 情况 
下 ， 所 用 的 CPU 资源 比 在 Q34 中 使 用 的 CPU 资源 大 许多 。 这 似乎 来 源 于 在 所 有 非 匹 配 索引 扫 撕 
中 的 索引 中 获得 的 值 上 测试 许多 BETWEEN 谓 词 的 必要 性 ， 同 时 表示 了 一 个 严重 的 资源 代价 。 

对 于 中 等 基数 的 列 ，KN ef{K100，K25，K10T，MX 处 理 对 于 来 源 于 在 KSEO 上 的 相同 
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图 9-33 对 于 Q3B 的 EXPLAN 方 案 ， 在 KN= 区 100 情况 下 
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BETWEEN 谓 词 的 RID 列 表 作 并 操作 ， 然 后 同 来 源 于 谓 闻 KN=3 的 RID 列 表 的 结果 做 相 艾 操作。 
例如 ， 图 9-33 给 出 了 KN=K100 时 的 计划 。 在 赂 9-32b 中 ， 你 应 当 和 假设 顺序 预 取 被 用 来 存 取 KN 
和 KSEQ 的 索引 值 ， 阿 时 列表 预 让 用 来 存 取 数 据 页 面 。 对 于 这 个 查询 组 ， 在 含有 最 小 基数 的 
列 的 黄种 情况 下 使 用 非 匹 配 的 索引 扫描 ， 这 也 许 是 DB2 查 询 优 化 器 犯 了 - -个 错误 ， 这 个 可 以 
根据 这 些 情况 中 CPU 使 用 中 的 天 步 味 茎 进行 判断 。 然 而 ， 它 的 性 能 同 其 他 的 太 多 数 产 品 相 比 
较 是 相当 好 的 ， 

6. Q4A 和 Q4B 查 询 

两 种 变型 查询 组 Q4A 和 Q4B 具 有 如 下 形式 : 


select KSEDO, KSODK from BENCH 
where <constradnt with 3 cod4ay or 5 [Ad4BY ANDed predicatesy: 


在 Q4A 组 的 查询 中 有 三 个 谓词 ，Q4B 系 列 的 查询 中 有 五 个 谓 闻 ， 它 们 都 从 图 9-34 的 十 个 谓 
词 的 序列 中 进行 选择 。 其 中 右边 的 一 列 是 每 个 谓词 的 过 滤 因 子 。 


K2 = 1 Kd = 3 
KI00 > BO KiDD < #1 


ElOK between 长 1 长 betweer 
LE 机 30 上 吕 850 and 950 


K5 = 3 KID 一 了 


{K25 = 11 or K25 = 19) kK25 between 3 and 4 





图 9-34 ”对 于 QQ4 组 ， 带 有 过 滤 因 守 FF 的 讲 词 序列 


查询 中 的 谓词 按照 ] ~ 10 的 顺序 依 序 选择 ， 给 定 一 个 起 始点 后 ， 按 照 顺 序 往 下 ， 到 达 末 端 
后 , 由 谓词 10 回 到 谓词 1。 例 如 ， 一 个 带 有 三 个 谓词 的 Q4A 的 查询 ， 它 起 始点 是 5， 那 么 这 个 
查询 拥有 谓词 的 范围 在 5 ~7 (也 就 是 {5, 6, 7} )， 查 询 具 有 如 下 形式 : 
5 eect KSEQ, KSOOK frem BENCHY 
where fkK25 = 11 or K25 ~ 19) and K4 = 3 and Kl00 < #1; 
带 有 五 个 谓词 并 昌 起 始点 为 7 的 Q4B 组 中 的 一 个 查询 ， 它 的 谓词 在 范围 7 ~ 1 中 (也 就 是 {7， 
8, 9,10, 1} )， 有 具有 如 下 的 查 体形 式 ; 


select KSEDO, KBOOK from BENEH 
Where KliDo < 41 and KK between BS0 and 380 and Kl = 7 


and kK25 beatween 3 and #4 and K2 = 1: 


在 Q4A 和 Q4B 中 测量 的 这 类 查询 是 具有 典型 性 的 查询 ， 它 们 来 源 于 文档 检索 (例如,， 通 
过 关键 字 、 它 们 所 在 的 期 刊 、 出 版 周期 来 限制 咨询 的 文章 ) 或 者 直接 的 电子 邮件 应 用 《例如 ， 
在 一 个 给 定 的 薪水 范围 内 、 性 别 、 爱好、 地 理 位 置 等 中 检索 候选 人 的 名 字 和 地 址 ) 的 最 终 形 
式 查 询 。 图 9-35a 和 图 9-35b 分 别 给 出 了 Q4A 和 Q4B 查 询 组 的 测量 结果 。 

EXPLAIN 告 诉 我 们 Q4A 包 含 的 所 有 查询 使 用 索引 打 描 或 者 MX 处 理 。 图 9-34 中 的 某 些 请 音 
不 能 用 来 索引 ， 比 如 谓词 (0)JFFE=1/2 ， 谓 词 (7)FF=17$ 和 要 求 非 匹配 索引 扫描 的 谓词 (3)， 在 RID 
的 处 理 中 不 支持 这 么 做 ， 理 则 -一 个 MU 步骤 能 获得 FF=2/25. 此 外 谓 词 (6XFF=1/4) 只 在 包含 请 间 
5-3 的 查询 中 使 用 ， 因 员 没 有 可 以 索引 的 谓词 (多 为 谓词 5 和 7 已 经 被 排除 在 外 )}。 如 同和 在 9.6 节 中 
解释 的 那样 ， 为 了 减少 返回 的 行 数 ， 末 使 用 过 的 谓词 将 不 被 使 用 。 所 有 的 查询 计划 使 用 那些 
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在 给 定 范 围 内 能 够 重用 索引 的 谓词 ， 这么 司 简 化 了 那些 包含 谓词 1~3 的 查询 些 在 谓词 2 和 3 上 
MX 处 理 (谓词 (1) 从 不 使 用 ); 包含 谓词 5~7 的 查询 通过 在 谓词 (6) 上 的 一 个 匹配 索引 扫描 得 以 解 
决 ， 而 这 些 查询 也 是 谓词 (6) 唯 一 被 使 用 的 地 方 ， 请 词 3 和 7 已 经 被 排除 在 外 ; 最 后 ， 包 含 谓词 
8~I0 的 查询 在 所 有 这 三 个 谓词 上 执行 MX 处 理 ， 因 为 其 中 没有 任何 一 个 朝 词 被 排除 在 外 。 


范围 bp) 间 ( 息 清 求 次 数 Uo 次 娄 3 
las || mm | 
一 
re i mm | | | 
sse | i | | 
ee | om | nn | 5 | m7 
oo 
ao 


图 35a Q4A 测 县 
谓词 序 取 | 执行 时 间 
范围 ( 秒 ) 





















CPU 时 | 效 取 奥 曾 | 随机 MO 堪 序 预 联 | 列表 预 取 
间 !( 秘 ) — -有 2 站 






图 9-3Sh CO4B 测 量 


掌握 了 所 用 的 谓词 后 ， 就 有 可 能 估计 出 表 中 要 访问 的 行 数 并 和 报告 的 HO 次 数 进 行 印证 。 
比如 ， 以 包含 谓词 8~10 的 查询 为 例 ， 过 滤 因 子 和 BENCH 表 中 的 行 数 目的 乘积 为 
(1710)1710)2725J1 000 000)=800。 因 为 没有 其 他 谓词 存在 ， 因 些 这 也 是 获取 的 行 总 数 ， 从 附 
录 户 中 我 们 可 以 看 到 确切 的 数目 中 785。 版 序 预 取 通 常用 来 访问 索引 数据 ， 列 表 预 取 通 常用 来 
访问 数据 页 面 。 因 为 将 要 获取 的 785 个 行 位 于 将 近 785 个 数据 页 面 上 ， 因 此 它们 可 以 通过 
CEIL(7850/32)=25 个 列表 预 取 取 人 和 人 内存 中 ， 具 体 数 字 参 见 图 9-35a 的 8~10。 

更 多 谓词 可 以 从 Q4B 的 5 个 谓词 中 和 术 生 出 来 ， 因 此 我 们 期 望 稳定 的 MX 姓 理 吞吐 量 和 较 小 
的 应 答 集 ，EXPLAIN 告 诉 我 们 Q4B 包 含 的 查询 都 在 三 个 谓词 上 使 用 MX 处 理 ， 除 了 谓词 (5) 外 ， 
这 些 谓词 都 具有 较 小 的 过 滤 因 子 , 而 谓词 (5) 要 求 非 匹 配 索 引 扫 描 或 者 MU 处 理 , 因此 从 未 使 用 。 
比如 ,包含 谓词 4.8 的 查询 和 谓词 (4).(6), 7), (8) 四 个 谓词 中 的 三 个 上 执行 MX 处 理 ， 它 们 的 过 
滤 因 子 分 别 为 1/5, 1/14, 25 和 1110， 选择 其 中 最 小 的 三 个 为 (4)。(6)，{8)。 再 举 一 个 例子 ， 包含 
谓词 7~1 的 查 鹿 有 (7}，( 中 ，C9)，(10)，(1) 几 个 谓词 供 选 择 。 选 择 其 中 三 个 具有 较 小 的 过 滤 因 
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子 的 谓词 为 (8).(9) 和 (10)， 这 和 包含 谓词 8~-10 的 Q4A 相 同 。 因 此 查询 @4A 和 Q4B 的 IO 开销 近似 
相等 。 然 而 ，Q4B 的 查询 结果 包含 的 行 数 日 要 比 Q4A(785 个 元 组 ) 少 ， 这 是 额外 的 两 上 谓词 (1) 
和 (7) 的 过 滤 因 子 带 来 的 影响 ， 结 果 大 约 是 (1/2)(215)(785)=157。 在 附录 万 中， 我 们 可 以 看 到 确 
团 的 数目 是 152。 

7. Q5 查 询 

Q5 查 询 具 有 如 下 形式 : 

For each pair (KN1. KH2) e ffTK2，K100)》，(K4。K25)，《K1D，K25) ) 


select KNl1, KN2, countdi*} from BEHCH 
group by KN1, KN2: 


图 9-36 给 出 Q5 查 启 组 的 测量 结果 。 


师 序 预 取 | 列表 预 取 
LD 次 数 


LDO 次数 





图 9-36 0Q5 测 量 


这 个 查询 组 是 一 种 称 为 交叉 表 【crosstab ) 应 用 的 代表 ， 它 用 在 决策 支持 系统 中 来 计 
算 在 人 群 中 一 种 因素 对 于 另外 一 种 因素 的 影响 。 例 如 ， 一 个 百货 商店 有 一 张 顾客 表 
(customers )， 其 中 的 列 合 有 诸如 爱好 (hobby ) 和 收入 阶层 ( incomeclass )， 还 有 在 
各 种 商品 的 购买 水 平 (1~10， 像 收 人 阶层 一 样 )。 例 如， 在 运动 装 店 的 
spPortgw_pPurchases。 对 于 QQ5 系 列 的 交叉 表 分 析 可 以 用 来 观察 在 顾客 的 爱好 和 他 购买 商品 
的 种 类 之 间 是 否 存 在 其 种 关联 : 


stelect couUnti*) from customers 
group by habby,. sportsw purchases; 


如 果菜 旦 爱好 {如 航行 ) 表 明 在 高 层次 的 商品 方面 有 很 高 的 汗 意 力 ， 那 么 给 这 群 人 发 信 告 i 
它们 即将 到 来 的 运动 装 店 的 销售 就 是 一 个 很 好 的 选择 。 

用 EXPLAIN 命 令 可 以 看 出 在 Q5 组 中 的 查询 以 两 步 方案 完成 。 第 - 步 {PLANNO=1 )，-- 
次 表 空 间 扫 措 《ACCESSTYE=R ) 扫描 所 有 数据 页 面 ， 然 后 抽取 出 列 对 ( KN1，KN2 ) 放 信 一 
个 临时 表 。 图 9-36 没 有 表明 完成 写 入 临时 表 的 L100 的 数目 ， 因 为 它们 没有 被 报告 。( 页 商 的 写 
通常 不 会 作为 方案 的 一 部 分 而 发 生 ， 而 是 发 生 在 缓冲 池 的 空间 用 完 之 后 ， 必 须 把 改变 的 页 面 
写 出 到 玉 盘 以 腾 出 空间 。 然 而 ， 这 个 数据 的 次 面 仅 侈 是 临时 使 用 ， 也 许 会 避免 完全 被 写 人 到 

盘 。) 在 第 二 步 (PLANNO=2 )， 在 列 KN1 和 KN2 上 执行 这 个 临时 表 上 的 排序 步骤 

( METHOD=3，SORTC_GROUPBY=Y )， 所 有 相同 的 结果 被 收集 在 一 起 ， 来 自 于 这 个 排序 的 
输出 中 ,每 一 个 相同 类 型 的 (KN1， KN2 ) 对 的 数目 被 累加 ， 并 且 放 人 管 案 集中 。 我 们 可 以 
在 图 9-36 中 看 到 一 次 表 空 间 扫 描 的 标记 ，1735 次 顺序 预 取 I/O， 这 就 是 我 们 在 以 前 看 到 的 。 
CPU 时 间 构 成 了 这 些 查询 耗 时 的 一 个 很 大 的 比例 ， 

8. 吕 6A 查 询 

Q6A 和 Q6B 查 谢 组 测量 两 个 天 的 连接 。Q6A 具 有 如 下 形式 : 
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Foar each KH ee {KIOOK, KaOK,. KlDK, KlK, KidOQ 
select countt*)y from BENCH Bl, BENCH Bz 
where BL.KN = 49 and Bl.K2SOK = B2. ksSO0K: 


图 9-37& 给 出 了 Q6A 查 询 组 的 测量 。 









( 秘 } 间 ( 秒 ) | ”请 求 次 数 LO 次 数 LO 次 数 
ms | om | slr | | 1 
em om | ml ?7 | | + 
ws om | w|i | | + 





图 9-37a QQ6A 测 县 


尽管 在 这 个 查询 中 BENCH 表 扮演 了 两 个 角色 B1 和 B2 ， 对 于 存在 两 个 不 同 表 的 情况 ， 并 不 
能 得 到 什么 优势 ， 只 在 组 冲 区 驻 留 略 有 提高 。EXPLAIN 告 诉 我 们 Q6A 组 的 所 有 查询 都 以 执行 
一 个 典 套 循环 连接 的 两 步 方案 来 完成 。 在 第 一 步 (PLANNO=1 ) 我 们 在 KN 上 使 用 一 次 匹配 索 
引 扫 描 以 抽取 出 行 的 RID 列 表 ， 而 行 是 从 外 表 抽 取出 来 的 (TABNO=1， 也 就 是 满足 
B1 .KN=49 的 行 )。 对 于 在 外 循环 从 B1 中 检索 到 的 行 ，B1 .K250K 有 一 个 固定 的 常数 值 ， 我 们 
用 K 来 代表 。 在 第 二 步 嵌 套 循环 连接 中 (METHOD=1 )， 假 设 来 自 外 表 B1 的 一 固定 行 ， 检 索 在 
B2 中 满足 B2 .K500K=K 的 行 的 数目 。 对 于 这 一 点 要 使 用 在 K500K 上 的 一 次 匹配 索引 扫描 ， 而 
目 因为 内 有 数目 被 检索 ， 这 一 步 具 有 INDEXONLY=Y。 注 意 ， 对 于 在 外 表 中 找到 的 每 一 行 ， 
我 们 希望 在 内 表 中 可 以 发 现 两 行 ， 轩 为 条 件 B2 .K500K=K 对 于 B2 中 大 约 黄 行 是 正确 的 ， 只 时 
K 存 在 于 1，2，…，500 000 的 范围 中 ; 又 因为 kK 从 B1 .K250FK 中 获取 ， 当 然 就 是 这 种 情况 。 因 
此 ， 对 于 KN 三 K100， 我 们 希望 在 外 表 中 发 现 10 000 行 ， 在 匹配 的 列 连 接 之 后 大 约 找到 20 000 
行 ， 这 些 列 决 定 了 来 自 于 内 表 在 最 终 管 案 中 的 行 的 总 数 。 从 附录 DD 我 们 可 以 看 到 检索 到 的 精确 
的 数字 是 19 948。 

在 这 种 情况 下 ，KN=K100， 在 外 循环 必须 要 存 取 来 自 于 B1 的 大 约 10 000 行 。 就 像 我 们 先 
前 在 分 析 Q2A 时 计算 的 那样 ， 大 约 有 9152 个 数据 页 面 ， 读 人 的 页 面 由 290 次 列表 预 取 IO 抑 成 : 
剩 下 的 LO 中 的 大 多 数 都 是 为 了 执行 最 后 的 计数 而 检索 从 K500K 索 引 上 的 叶子 层 的 项 。 

9. Q6B 查 询 

Q6B 查 询 具 有 如 下 形式 : 

For each KN € {40 KlQK, Klk, KIDO) 


select Bl.KSEO, B2.KRSEQ from BENCH Bl, BENCH BZ 
whare Bl.KN = 99 and Bl.K2S5OK = B2,KSO0K and BBS.K25 = 19: 


对 于 查询 Q6B 组 的 测量 参见 图 9-37b。 

除了 对 表 B2 有 新 的 限制 (B2 .K25=19 ) 以 外 ， 查 询 Q6B 和 Q6A 类 似 ， 党 实 上 ， 从 两 个 表 
中 的 列 检 索 的 是 数据 而 不 是 计数 值 。EXPLAIN 命 令 显 示 嵌 套 循 环 连接 (METHOD=1 ) 被 用 于 
Q6B 组 的 KNEE {K40K， Kl10K， KlK} 的 查询 中 ， 而 当 KN=K100 时 应 用 归并 连接 
(METHOD=2 )。 
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执行 时 间 ICPU 时 1 获取 页 面 0 顺序 了 预 取 | 列表 怖 本 
{ 私 ) 间 { 秘 } | 请 求 TO 次 数 J1O 次 数 


i | 
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EE 
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em ne me 


图 9-37bh _Q6B 测 量 


我 们 以 俘 套 连接 查询 (METHOD=1! ) 过 程 作 为 讨论 的 开始 ， 该 方案 十 分 类 似 于 用 于 Q6A 
组 中 的 所 有 查 询 的 方案 。 在 KN 上 的 一 次 匹配 索引 扫描 用 来 取出 从 外 表 中 得 到 的 行 ， 其 中 
B1,XN=99。 对 于 检索 自 B1 的 每 一 行 ， 我 们 用 K 来 表示 B1.K250K 这 个 固定 的 常数 值 。 在 内 循 
坏 中 ， 不 从 K500K 索 引 上 检索 一 个 计数 值 ， 而 是 在 B2 中 检索 满足 条 件 B2 .Kx500K=K 的 行 。 通 
过 测试 条 件 B2 .K25=19 来 对 这 些 行进 行 限制 ， 结 果 行 同 来 自 于 外 表 B1 的 行 连接 。 注 音 ， 对 于 
在 外 下 中 找到 的 每 一 行 ， 我 们 希望 在 内 表 中 找到 满足 条 件 B2 .K500K=K 的 行 ， 它 们 大约 为 两 
行 ， 就 像 在 Q6A 中 讨论 的 那样 。 然 而 ， 这 次 只 有 当 B2 .K25=19 时 结果 行 才 会 存在 于 答案 集合 
中 ， 因 此 在 连接 中 的 整个 行 的 数目 缩减 到 原先 的 1125。 在 KN=K1K 的 情况 下 ， 我 们 期 望 在 外 
表 B1 中 检索 到 1000 行 并 旦 在 内 表 B2 中 检索 到 2000 行 ， 但 是 在 最 后 的 连接 中 仅 有 【1725) x 
{ 2000 } =80 行 。 就 像 我 们 在 附录 了 DD 中 见 到 的 那样 。 精 确 的 数字 是 81 行 。 注 意 到 ， 在 图 9-37b 中 ， 
这 种 情况 的 10 的 数 归 记 在 Q6A 中 发 生 的 VO 数目 几乎 是 相等 的 ， 只 是 多 了 2827 次 随机 WO。 我 
们 期 望 通过 谓词 82 .K500K-19 在 表 E2 中 存 取 行 ， 对 于 在 外 表 中 找到 的 1000 行 中 的 每 一 行 需 
要 三 次 MO ( 一 次 是 索引 页 面 ， 两 次 是 数据 页 而 )，、 训 无 疑问 ， 比 数 卓 2827 小 一 些 是 因为 缓冲 
命中 kK500K 索 引 寺 子 页 面 。 

在 Q6B 情 况 下 ， 其 中 KN 三 K100， 发 生 了 一 次 归并 连接 。 在 第 一 步 ，B1 中 满足 条 忻 
Bl1.K100-99 的 所 有 行 被 在 K100 上 的 一 次 索引 扫描 选择 ， 并 且 投 影 到 两 列 的 行 上 
(B1.KSEO， B1.K250K)， 放 置 于 一 个 临时 的 中 间 表 ITl 中 。 类 似 地 ， 在 B2 中 满足 条 件 
B2 .K25-19 的 行 被 在 xK25 上 一 次 索引 扫描 选择 ， 并 且 投 影 到 行 { B2 .KSEQ, B2.K500 )， 
放置 于 临时 表 IT2 中 。 表 IT1 和 IT2 被 拢 序 ，IT1 按 B1 .K250K 来 排序 ，TT2 按 B2.K500K 
来 排序 。 使 用 图 9-21 的 向 前 移动 的 游标 过 程 ，IT1 和 IT2 在 Bl .K250K=B2 .K500K 上 进行 
连接 。 考 虑 IO 资源 ， 我 们 可 以 看 出 在 Bl1 .K100 上 的 索引 扫描 要 求 一 次 顺序 预 取 IHO 来 检索 
相应 的 索引 ， 然 后 用 许多 列表 预 取 1G 检索 大 约 10 000 行 。 这 10 000 行 存在 于 很 多 页 面 上 ， 
这 些 页 面 由 Q2A 中 的 讨论 来 计算 ，58 824(1-e 2) = 9196。 这 样 需要 用 来 存 取 这 些 行 的 
列表 匣 取 LO 为 CEIL (9196/32) = 288。 在 B2 .K25 上 的 索引 扫描 需 要 大 约 两 次 顺序 现 取 I/O 
以 检索 相应 的 索引 ， 并 需要 许多 列表 预 取 LO 用 来 检索 大 约 40 000 行 。 检 索 这 些 行 大 致 需 权 
55 $56(1 -el “m28 514 页 ,这 意味 着 我 们 将 需要 CEIL(28 514132)=892 次 列表 甫 取 IO。 
对 于 列表 预 了 的 总 数目 ， 我 们 可 以 计算 为 288 + 892 = 1180， 很 接近 于 测量 的 值 1190。 


9.11 性 能 价格 比 评估 


集合 查询 基准 程序 以 每 分 钟 每 个 查询 的 美元 代价 《 $/QPM ) 为 硬 /软件 平台 提供 了 一 种 信 
计 方 式 。 因 为 所 有 的 平台 都 提供 相同 的 数据 和 对 于 相同 的 查询 答案 作出 响应 ， 而 提供 这 些 大 
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询 结果 的 美元 代价 被 认为 是 -- 个 相当 好 的 量度 。 一 个 平台 的 QPM 代 价 是 很 容易 计算 的 .在 基 
准 程 庆 中 有 69 个 查询 ， 所 有 都 具有 相同 的 权重 。 如 果 我 们 调试 基准 程序 的 所 有 查询 的 执行 时 
闻 为 T 分 钟 ， 那 么 我 们 以 每 分 钾 597T 个 查询 的 速度 在 运行 。 加 上 在 9.10 节 中 的 对 于 所 有 查询 
的 执行 时 间 ， 我 们 得 到 4492.24 秒 ， 即 74.87 人 分钟， 因此 QPM 的 值 是 每 分 钟 69174.87 = 0.9216 
个 查询 。 

系统 的 美元 代价 代表 了 5 年 期 限 内 的 硬件 、 软 件 和 维护 的 费用 。9.10 节 测量 的 查询 的 平台 
是 IBM 92217170 型 ， 运 行 于 MVS XA2.2 操 作 系 统 之 上 的 DB2 版 本 2.3。 对 于 这 个 系统 的 5 年 价 
格 是 基于 在 图 9-38 中 纵 出 的 从 1993 年 十 月 起 的 零售 价格 。DASD (IBM 的 磁盘 名 称 ;的 价格 
是 一 个 例外 ， 代 表 过 去 的 价格 ， 因 为 这 样 的 设备 ] 了 ME 已 不 再 销售 。 注 意 ， 每 个 月 的 维护 费用 
在 拥有 硬件 的 第 一 年 内 是 免费 的 ， 因 此 只 有 48 个 月 需要 付费 。 软 件 通常 是 不 能 够 被 购买 的 并 
且 前 2 个 月 是 免费 的 ， 因 此 要 按 月 为 软件 使 用 许可 付费 ( 对 于 MVS 操 作 系 统 有 一 个 少量 的 初 
始 费用 >) 

经 过 测试 ，DPB2 系 统 的 总 的 美元 代价 为 $296 705+$912 300=$1 209 000。 这 支持 了 QPM 的 
值 为 0.9216， 同 时 我 们 通过 美元 代价 被 QPM 数 值 除 计算 最 后 的 比率 。 对 于 集合 查阅 基准 程序 
的 在 这 个 平台 上 的 最 后 比率 为 $t 209 005/10.9216=] 311 854$7QPM 。 
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图 9-38 ”对 于 DB2 系 统 的 价格 计算 


1. 执行 时 间 同 CPU 时 间 上 比率 比较 

我 们 在 上 面 的 估算 中 测试 了 执行 时 间 。 然 面 ， 这 并 不 能 得 到 多 用 户 系 统 时 的 正确 评估 。 
候 设 我 们 需要 10 分 钟 在 某 个 平台 上 运行 所 有 的 集合 查询 基准 程序 的 查询 ,但 是 做 这 件 革 仅仅 
使 用 1 分 钟 的 CPU 时 间 一 一 更 长 的 执行 时 间 在 于 对 于 LO 的 等 待 。 如 果 我 们 有 许多 用 户 在 等 待 查 
询 的 结果 ， 难 道 我 们 不 可 以 通过 对 CPU 进行 时 间 共 部 使 一 些 用 户 重合， 从 而 可 以 在 每 分 钟 内 
得 到 更 多 的 查询 吗 ? 答案 是 肯定 的 。 如 果 我 们 有 几 个 蔽 盘 来 保留 数据 ， 那 么 磁盘 LO 就 不 会 成 
为 瓶颈 ， 同 时 在 CPU 上 重 亚 的 查询 能 够 发 现 重 亚 的 磁盘 以 检索 需 他 的 数据 。 一 昌 给 出 了 这 些 ， 
在 估计 费用 方面 ， 使 用 CPU 时 间 比 执行 时 间 显 得 更 有 意义 。 

采用 这 步 碰 到 的 唯一 问题 是 集合 查询 基准 程序 已 经 以 一 个 单 用 广 基 准 程序 运行 了 。 如 果 
我 们 在 系统 的 多 个 磁盘 上 同时 运行 多 个 用 户 ， 我 们 将 以 这 种 方式 进行 概括 ， 而 且 更 为 正确 ， 
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但 是 我 们 不 能 绝对 相信 在 并 发 用 户 查 询 之 间 没 有 某 种 系统 干扰， 这 就 使 得 这 种 多 用 户 的 情况 
成 为 一 种 幻想 。 对 十 这 种 于 扰 没 有 任何 理论 上 依据 一 一 在 这 里 ， 没 有 在 第 10 章 中 更 新 事务 时 
砸 到 的 行 上 的 排 它 的 锁 和 其 他 复杂 情况 。 但是， 当 我 们 要 得 出 在 系统 中 使 用 所 有 的 CPU 时 间 
这 个 结论 时 ,我们 信人 须要 小 心 。 一 方面 ，CPU 资 源 的 利用 几乎 接近 于 100%， 用 户 形成 越 来 械 
长 的 队列 来 等 待 CPU 服务 ， 这 对 响 庶 时 间 有 -个 负面 的 影响 。 在 一 个 合理 的 平衡 的 产品 系统 
中 我 们 希望 CPU 的 利用 率 为 90 旬 。 注 意 ， 如 果 我 们 在 PB2 平 台 上 计算 集 人 台 碍 询 基 准 程序 的 69 
个 查询 的 执行 时 间 ， 我 们 可 以 得 到 74.87 分 钟 ， 但 是 我 们 计算 整个 CPU 时 间 ， 我 们 可 以 得 到 
24.77 分 钟 。 这 是 三 比 一 的 差距 ,还 没有 太 到 会 引起 很 大 的 关注 。 如 果 并 发 查询 可 以 在 一 个 多 
用 户 系 统 上 没有 干扰 地 执行 {我们 从 其 他 的 测试 中 可 以 有 理由 相信 这 里 是 DB2 测 试 的 情况 )， 
那么 才 用 户 代 价 也 许可 以 由 1 311 854$/QPM 降 到 只 有 500 000$AQPM。 在 其 一 点 上 ， 考 虑 一 个 
允 用 户 测试 是 适合 的 ， 看 查询 是 否 在 CPU 上 有效 地 重 亚 也 是 适合 的 。 

2. 定制 比率 

重新 理解 集合 查询 基准 程序 的 测试 来 在 一 个 特定 的 查询 负荷 上 来 合算 测试 平台 的 行为 是 
可 能 的 。 基 准 程序 查询 组 己 经 被 选择 来 疏 越 查询 工作 的 天 多 数 类 型 ， 对 于 一 个 来 自 于 基准 程 
序 的 一 个 特定 的 查询 ， 给 出 一 个 定制 的 工作 负荷 是 可 能 的 。 如 果 被 估算 的 工作 人 负荷 包含 了 在 
集合 查询 系列 中 没有 包 合 的 查询 形式 ， 就 需要 一 些 复杂 的 灵活 性 ， 带 有 冲突 数据 存 取 的 并 发 
更 新 事务 的 一 个 工作 负荷 不 能 够 以 这 种 方式 建 模 。 我 们 将 会 和 下 到 时 新 事务 的 - -个 特定 的 工作 
负荷 的 基准 程序 ， 即 第 10 章 中 的 TPC-A 基 准 程序 。 

假定 我 们 要 确定 一 系列 的 权 值 , W 来 代表 基准 查询 Q, 的 相对 工作 负荷 频率 , 其 中 [从 1 到 69 ， 
同时 假定 折 有 的 权 值 都 是 非 负 的 《有 些 可 能 是 0 ) 并 且 相 加 为 1.0。 集 人 台 查 询 基 小 程序 的 规则 
说 所 有 查询 代价 必须 详细 好 报告 ， 国 旧 我 们 总 是 可 以 得 到 执行 时 间 、CPU 时 间 和 对 于 每 一 个 
查询 的 各 类 WO。 现 在 ， 我 们 假定 查询 Q, 需 要 TT 执行 时 间 来 完成 ， 我 们 可 以 通过 如 下 公式 来 计 
算 加 权 的 执行 时 间 : 

= 一 个 吉 权 查询 的 执行 时 间 = WiTi 

权重 W, 之 和 为 1.0， 因 此 数值 E 可 以 被 看 做 是 在 基准 程序 中 所 有 查询 效果 的 总 和 所 对 应 的 
一 个 简单 查询 所 需要 的 以 分 钟 为 单位 的 执行 时 间 。 所 以 ,每 分 钟 的 查询 数目 Q, 对 于 这 样 的 权 
以 11E 给 出 。 如 果 C 是 在 基准 程序 运行 的 平台 上 的 美元 代价 ， 那 么 以 $1QPM 为 单位 的 定制 比率 
通过 C 被 Q。 除 而 得 到 ， 或 者 等 惟 地 通过 C 被 E 乘 得 到 。 

最 终 的 权 值 的 比率 =C xE= WiT (以 SAQPM 为 单位 ) 

为 了 测试 这 是 否 有 意义 ， 注 意 一 个 较 大 的 比率 代表 较 低 的 性 能 ， 这 是 因为 代价 上 升 或 
QPM 值 下 降 。 可 以 确定 地 说 ， 如 果 在 最 终 的 权 值 的 比率 中 的 平台 价格 C 上 升 ， 就 是 说 ， 因 为 
走 主 提高 了 平台 的 价格 ,一 个 更 大 的 费用 反映 了 一 个 更 低 的 性 能 昼 格 比 。 如 采 含 有 -~ 个 湛 的 
权 值 的 T 值 中 的 一 个 上 升 了 ， 表 明 某 个 查询 占用 更 长 时 间 。 

注意 ,在 最 近 的 子 节 中 讨论 的 用 CPU 时 间 代 替 执 行 时 间 的 所 有 考虑 ， 在 定制 负荷 上 仍 
然 有 效 。 热 行 一 个 单独 的 测量 集 的 优点 在 于 : 通过 在 一 个 工作 负荷 中 使 用 不 同 的 查询 权 值 
对 于 查询 进行 定制 是 可 能 的 。 在 一 个 多 用 户 测试 中 ， 通 常 的 过 程 是 选择 … 个 特定 的 工作 抽 
荷 ， 并 目测 试 整个 的 执行 时 间 。 对 于 和 不同 查 询 的 单独 测试 是 不 能 获得 的 ， 所 有 是 制 的 比率 
得 不 到 。 然 面 ， 如 果 在 并 发 查询 中 的 非 千 扰 假设 成 立 ， 我 们 可 以 在 限定 的 环境 中 得 到 一 个 
近似 的 定制 多 用 户 的 比率 。 





448 ” 费 据 亩 属 理 、 编 租 与 姓 能 


3, DB2 和 ORACLE 之 间 索 引用 法 的 不 同 

对 于 所 有 数据 库 产 品 的 每 一 个 最 新 版 本 ， 在 索引 的 使 用 上 彼此 有 不 同 的 限制 。 就 像 在 版 
本 7 中 ，ORACLE 除 了 等 价 匹 配 外 不 能 组 合 任 何谓 词 ， 同 时 对 于 谓 阅 c1 is null 也 不 能 使 用 
一 个 索引 。 通 常 ，DB2 的 2.3 版 本 在 那 时 具有 在 查询 优化 方面 的 最 先进 的 技巧 包 ， 这 种 说 法 是 
公正 的 ,但 是 最 近 的 发 展 可 能 会 改 焉 这 一 点 。 
推荐 读物 

大 多 数 数 据 库 产品 的 标准 SQL 参考 手 其 在 理解 查询 优化 方面 提供 的 引 守 很 少 。 然 而 ， 
DB2 Administration Guide ? (推荐 读物 [1 和 《DB2 Applications Programmins and SOL Guide » 
(推荐 读物 [2]) 对 于 在 本 章 中 提 到 的 内 容 有 相当 好 的 介绍 。DB2 UDPB 在 推荐 读物 13] 和 推荐 读物 
[4 中 有 相应 的 介绍 。ORACLE 在 《Server Administrator ”5s Guide》 (推荐 读物 [7 和 机 《Server 
Tuning》( 推 荐 读物 [ 吧 中 都 有 相应 的 内 容 。 在 《The Benchmark Handbook 3 (推荐 读物 [6]) 一 书 
中 提供 了 集合 查 疝 基准 程序 的 更 为 详细 的 细节 。Goetz Graefe 的 关于 查询 评估 技术 的 论文 ( 推 
荐 读物 [5]) 解 释 了 儿 种 我 们 这 里 届 有 握 到 的 基本 承 理 ,尽管 在 现在 的 商业 数据 库 系 统 中 这 些 厚 
理 尚 未 实现 ， 但 是 在 不 久 的 将 来 可 能 会 出 现 。 

[1] DB2 for OW390 VS Administration Guide. See Chapter 2, “Designing a Database， and 
Chapter $5, “Performance Monitoring and Tuning.” Document no. SC26-8957-02. IBM. 
Available at www.ibm.com/db2. 

[2] DB2 for O390 VS Applications Programming and SOL Guide. In particular, See Chapter 
6, Section 4, “Using EXPLAIN to Improve SQL Performance.” Document no. SC-26- 
S95B-02. IBM. Available at www.ibm.comdb2. 

13] DB2 Universal Database Adminisiration Guide: Design and Impiementation. VO. See 
Document no. SCO92-2840-00. IBM. Available at www.ibm.com/db2. 

[4] DB2 Universal Datapase Adminisiration Guide: Performance. V6. In particular, see 
Chapter 6 “SQL Explain Facility, Document no, SC09-2840-00, IBM., Available at 
www.ibm.com/db2. | 

E5j Goetz Graefe. “Query Evaluation Techniques for Large Databases.” ACM Computing 
Surveys 2502), June 1993, pp.73-170. 

[8] Jim Gray, editor, The Benchmark Haondbook for Database and Transaction Processing 
Systems, 2nd ed. San Mateo, CA: Morgan Kaufmann, 1993, Available at 
http:i//www.benchmarkresources.com/handbook. 

[TIORACLES Server Administrator’' s Guide. Redwood Shores, CA: Oracle. 
http:i/www.oracle.com. 

[BS] ORACLES Server Tuning. See Chapter 21, “The EXPLAIN PLAN Command.” 
Redwood Shores, CA: Oracle. http:// www.oracle.com., 

[9] ORACLES Server SOL Reference Manual. Volumes 1 and 2. Redwood Shores, CA: 
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习题 
在 书后 “习题 解答 ”中 有 管 案 的 对 是 用 符号 :标注 。 


第 9 草 查 确 处 型 3449 


丛 涉 及 到 对 十 MO 的 执行 时 间 的 习题 中 ， 通 常 你 应 当 假 设 案 引 目录 页 面 是 带 驻 内 存 的 ， 而 
索引 叶子 页 面 却 不 是 ， 除非 特别 说 明 ,。 当 索引 LO 加 起 来 不 到 总 数 的 10% 时 ， 在 你 的 答案 中 息 
略 它 。 然 击 ， 你 应 当 很 小 心地 包 会 对 于 索引 LO 的 计算 ,说 明 为 什么 你 认为 它们 是 不 重要 的 。 
下 面 的 习题 假定 DPB2 体 系 结构 {有 特别 说 明 的 例 站 )， 也 就 是 说 4KB 的 页 面 、 在 一 棵 B 树 的 叶子 
层 压缩 等 等 。 

9.1 DB2 被 设计 成 为 在 -- 次 索引 扫描 的 一 个 部 分 使 用 顺序 观 取 WO ( 就 像 从 案 引 中 读 人 的 
情况 ) 而 不 是 另外 一 种 在 例子 9.3.4 中 的 非 簇 聚 的 情况 下 读 人 数据 页 面 ， 它 是 基于 索引 中 找 
出 的 RID 的 情况 下 )。 在 本 题 中 ， 我 们 将 对 磁盘 控制 器 不 把 回答 以 后 的 页 面 请 求 的 磁道 放 人 内 
存 以 便 可 以 利用 DB2 的 灵活 性 的 情况 和 缓冲 区 一 次 读 人 一 条 完整 的 磁道 ( 我 们 认为 是 32 磁 盘 
页 页， 每 页 4KB ) 的 情况 相 比 较 。 

(a} 。 对 于 组 成 一 次 I1O 的 成 分 利用 图 9-6 的 值 来 计算 对 于 一 次 32 页 硕 序 WO 需要 的 时 间 
( 假设 依次 读 人 32 页 需要 -- 次 寻 道 时 间 和 一 次 旋转 等 待 并 且 扩 展 了 传输 时 间 )， 
在 顺序 MO 假设 下 ， 写 出 每 页 多 少 秒 的 结果 。 这 就 是 当 使 用 DB2 拔 序 颈 取 或 者 当 
磁盘 控制 器 从 一 -个 新 道 读 人 单个 磁盘 页 面 时 发 生 的 事情 。 

(b) 计算 例 98.3.3 的 唯一 坚 配 查询 执行 的 时 间 : 

(i) 假设 对 于 每 一 检索 的 让 面 ， 磁 盘 驱 动 器 把 一 条 完整 的 磁道 法人 磁盘 缓冲 区 。 
再 假设 从 一 个 唯一 的 匹配 到 嚼 外 一 个 没有 缓冲 节省 ， 因 为 对 于 这 个 缓冲 区 有 
太 多 的 不 同 的 页 面 以 致 地 没有 任何 帮助 。 
fii) 假设 是 单 页 的 随机 LO { 对 于 每 一 LO 重复 图 9-6 中 的 所 有 成 分 )。 
(c)*。 对 于 例 9.3,5 再 一 次 计算 花费 的 时 间 。 
中 在 8 页 预 取 的 假设 下 。 
[iD 在 单 页 随机 LO 的 假设 下 。 

在 这 种 情况 下 ，8 页 顺序 UVO 可 以 提高 执行 时 间 的 性 能 。 

(d) 竹 虑 在 (by【( 类 型 (b )) 中 提 到 的 那个 查询 的 一 些 数目 W1 的 一 个 工作 人 负荷， 和 在 
(c) {类 型 (ec ) ) 中 提 到 的 查询 的 W2。 当 需要 预 取 WO 时 ， 类 型 (b) 的 查询 有 一 个 
运行 时 间 的 缺点 ， 而 当 需 要 和 随机 THQ 时 ， 类 型 (ec 查询 有 一 个 缺点 。 

(i) 选择 权 值 W1 和 外 2， 使 得 对 于 两 种 选择 ( 随机 1O 或 者 8 页 预 取 )， 在 工作 负荷 
中 的 VO 的 总 的 执行 时 间 是 相隔 的 。 我 们 假设 类 型 (bp) 的 查询 比 类 型 (c) 的 查询 
出 现 得 更 频 党 。 

(ii 现在 ， 当 我 们 对 于 不 同 的 查询 在 预 取 LO 和 随 宙 IO 的 选择 上 具有 灵活 性 时 ， 
计算 每 一 个 查询 的 总 的 执行 时 间 。 

9.2 ”这 个 问题 重复 8.6 节 给 出 的 数学 推导 。 如 果 学 过 基本 概率 课程 ， 你 应 当 著 无 困难 地 得 
出 结果 。 你 可 以 通过 编写 一 个 带 有 随机 数 发 生 器 的 程序 模拟 来 产生 你 的 结果 。 

(9， 考 虚 例 9.3.3 的 唯一 匹配 索引 ， 它 带 有 一 个 employees 表 ， 这 个 表 有 100 000 
行 ， 每 行 400 字 节 。 假 设 数 据 页 面 和 ei dx 索引 10 字 节 的 项 ) 具有 
PCTFREE=0， 因 此 ， 有 10 000 个 数据 页 面 ， 并 有 生 有 一 个 深度 为 2 的 含有 250 叶 
子 页面 的 B 树 索引 。 

现在 假设 我 们 有 一 系列 内 存 缓冲 区 ， 通 过 一 个 算法 来 确定 内 存 中 的 页 面 ， 当 一 页 面 在 

125 秒 内 没有 被 引用 ， 那 么 把 这 页 面 从 缓冲 区 中 删除 。 很 设 我 们 的 工作 负 项 每 秒 板 行 例 
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3.3.3 中 的 那 类 查询 的 两 个 、 并 且 使 用 - -个 随机 选择 的 eid 值 ， 这 是 工作 针 茶 中 引用 
empiovees 表 或 者 ei dx 索引 的 唯一 的 查询 类 型 .每 一 次 执行 这 些 查 询 中 的 一 个 ， 并 
3 引用 索引 eidx 的 B 树 的 一 个 根 节点 ， 轩 此 根 节 点 总 在 内 存 中 。 注 意 ， 如 果 被 引用 的 
elia 值 被 正确 地 选择 来 通过 eidx 叶 子 节点 计算 ， 那 么 125 秒 后 250 个 时 子 节点 的 每 一 个 都 
将 被 引用 到 ， 它 们 都 将 驻 留 在 缓冲 区 中 。 那 种 情况 是 不 可 能 发 生 的 ， 耳 为 eiq 的 值 是 
随机 被 选择 的 。 

(by。() 一 个 给 定 的 叶子 节点 在 任何 给 定 的 查询 上 被 引用 的 概率 P(eaf) 是 多 少 ? 

(ii) 提供 一 个 不 被 -一个 给 定 查询 引用 的 叶子 节点 的 概率 的 公式 。 

(iii) 对 于 一 个 给 定 的 叶子 节点 不 被 在 一 行 中 查询 的 某 个 数字 N 引 用 的 概率 ， 给 
出 它 的 公式 。{ 提示 : 这 里 览 涉 及 到 短 )。 

Gv) 使 用 一 个 计算 器 、 给 出 索引 eiqx 的 B 树 的 叶子 节点 没有 被 最 近 的 250 个 查 
询 ， 即 125 秒 内 引用 的 概率 ， 因 此 它 不 会 常 驻 缓冲 区 。 

(w 在 缓冲 区 中 出 更 叶子 节点 的 期 望 数字 是 多 少 ? 

(vi 以 N 支 飞镖 投向 M 个 随机 空位 的 术语 来 陈述 这 个 问题 . 就 像 在 8.6 季 中 讨论 
的 一 样 。 执行 那 -- 节 指数 形式 的 计算 。 

(i) 对 计 表 empbloyees 的 数据 负面 ， 重 复 人 b) 的 所 有 步骤 。 

(ii 在 最 后 125 秒 肉 ， 包 括 壹 引 要 页面 和 其 他 页 面 在 肉 ， 有 风 少 实际 的 数据 库 丰 
面 被 引用 ? 对 索引 叶子 页 面 的 引用 有 多 少 ? 对 数据 页 面 的 引用 有 多少 ? 

[ii 在 那 段 时 间 ，、 大 约 有 多 少 索 引 叶 子 页 面 被 引用 ? 有 多 少数 据 页 向 被 引用 ? 
( 一些 页 面 已 经 被 引用 了 两 次 或 多 次 ， 但 是 统计 时 只 算 一 次 。) 

kivj* 说明 为 什么 保留 在 内 存 中 的 叶子 页 面 的 数量 要 小 于 数据 页 面 的 数量 。 

(d) 为 了 保留 在 最 后 125 秘 内 所 有 引用 的 页 面 都 在 缓冲 区 请 驻 ， 和 需要 上 出 现在 绥 冲 区 中 
的 页 面 的 大 致 数量 B 是 多 少 (包括 B 树 和 数据 页 面 }? 

(e) 最 普遍 的 形式 LRU 缓 冲 算法 ， 使 用 某 种 良好 定义 的 P 缓 冲 页 面 池 : LRU 把 每 一 新 
引用 的 页 面 放 人 池 ， 同 时 把 长 期 没有 被 引用 的 页 面 删除 以 腾 出 空间 。 为 了 保证 
每 一 被 引用 的 页 面 有 大约 125 秒 的 生命 周期， 给 出 一 个 目前 必须 出 现 的 我 们 到 目 
前 为 止 处 理 的 查询 芍 页 面 数量 的 估算 。 说 明 你 的 答案 。 

(DD :假设 在 缓冲 区 中 的 页 面 被 引用 时 导致 了 一 次 0 代价 的 IO， 而 在 缓冲 区 外 的 页 面 
的 代价 为 1( 我 们 不 得 不 把 它 从 厂 盘 上 取 回 ， 这 里 是 一 个 单元 六 对 于 在 这 里 假 
设 的 查询 工作 负荷 ， 它 的 每 秒 IO 代 价 是 什么 ? 【你 可 以 从 (bj 和 (ec) 部 分 的 结果 
来 计算 。) 

Cg) 根 设 我 们 把 在 缓冲 区 中 的 页 面 的 生命 期 从 125 秒 扩展 到 250 秒 。 计 算 -- 下 ， 这 将 
如 何 影响 本 习题 {b) 的 《ivw) 和 (vV)，(e) 的 人 站，(d]，(e) 和 (人 (。 我 们 可 以 做 的 融 是 通 
过 购买 额外 的 内 存 来 保留 更 多 的 缓冲 页 面 ， 从 而 减少 DO ( 磁盘 臂 ) 的 代价 。 

(h)* 如 果 我 们 怡 好 有 251 个 缓冲 页 面 ， 并 且 在 缓冲 区 中 保留 ei ax 根 页 面 和 所 有 eidx 
的 叶子 页 而 ， 间 时 删除 所 有 数据 页 面 ， 那么 每 秘 的 VO 代价 将 是 多 少 ?” 由 此 可 以 
得 出 这 样 的 结论 : 在 一 个 固定 长 度 的 时 和 内 保留 所 有 页 面 的 想法 不 是 最 优 的 。 


CC 


a 


9.3 用 C 语 言 写 攀 人 人 式 的 SQL 程 序 来 模仿 习题 9.2 的 缓存 的 铺 扩 。 


(3) 输入 eigx 叶 子 页 面 的 数目 N 和 employees 数 据 页 面 的 数 日 M。( 我 们 将 在 习题 
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9.2 的 情形 中 用 N=250 和 M=10 000。) 我 们 用 KK 代表 一 页 在 被 从 缓冲 区 删除 及 必须 
经 过 的 未 被 引用 的 秒 数 。 (注意 ， 这 不 是 一 个 LRU 方 法 。}) 假设 - 秒 钟 执行 两 个 
查询 ， 引 用 某 个 叶子 页 面 利 数据 页 面 。 定 儿 一 个 被 每 个 查 鹿 凋 用 的 肾 数 ,返回 
查询 后 仍然 保留 在 内 存 中 的 不 同 叶 子 碳 而 和 数据 页 面 的 数 日 .使 用 一 个 随机 数 
发 生 器 来 产生 对 于 查询 的 -: 个 叶子 页 而 和 一 个 数据 页 面 的 随机 引用 的 数 月 ， 如 
果 你 对 很 长 序列 的 查询 结果 进行 平均 ( 相 一 行 中 调用 函数 100 次 左右 、 一 号 系统 
答 唤 醒 ， 页 面 就 被 删除 )， 你 应 当 得 到 习题 9.2(bJfvy 和 9.2(c) 中 相同 的 效果 -【 注 
意 ， 写 这 样 的 程序 最 困难 的 部 分 是 执行 有 效 的 香 找 看 是 可 有 一 新 的 被 引用 的 页 
面 己 经 在 缓冲 区 中 ， 如 果 不 是 ， 需 要 确定 哪 一 页 应 当 从 缓冲 区 中 删除 然而 ， 
对 于 这 个 习题 编写 高 效 的 代码 是 没有 必要 的 。 最 简单 的 方法 就 是 在 两 个 大 的 数 
组 中 对 于 所 有 MA+N 个 页 面 保 持 引 用 次 数 。) 你 应 当 考 虑 用 数据 库 中 的 表 来 存放 这 
些 数 据 。 

(b) 使 用 fa 中 的 N 和 M 的 值 ， 编 写 --- 个 LRU 组 人 存 的 模拟 程序 ， 它 以 值 为 B 的 输入 给 出 
一 个 输入 的 固定 缓冲 区 天 小 。 查 潭 基数 应 当 返 回 在 等 个 新 查询 的 缓冲 区 中 没有 
发 现 的 页 面 数量 ( 值 0，1 或 2)， 还 有 从 缓冲 区 被 删除 的 页 面 的 存在 时 间 ,;， 当 系 
统 被 唤 醴 时， 查询 果 数 的 调用 者 应 当 显 示 出 页 面 存 在 时 间 井 始 的 序列 。 通 过 看 
存在 时 间 的 这 个 州 表 检查 习题 9.2(e}) 的 结果 。 把 -: 个 长 系列 的 返回 值 进行 半 均 以 
属 算 一 个 查询 的 平均 WO 代价 ， 间 时 检查 习题 9.2 的 (人 和 (tg) 的 计算 结果 。 

9.4 ”假设 有 一 个 含有 十 人 忆 万 行 的 表 T， 每 一 个 行为 200 字 节 ， 装 载 时 90%% 满 ， 但 是 对 十 案 
引 是 100% 满 。 假 设 我 们 在 T 的 (C1, C2, C3, C4) 上 有 索引 C1234X， 表 T 由 这 个 索引 进行 徐 聚 . 
我 们 在 T 上 的 (C5, C6, C7, C8) 上 有 索引 CS5678X， 运 行 EXPLAIN 后 ， 我 们 发 现 C5678X 的 
CLUSTERRATIO 是 20。 根 设 每 列 -一 C1,C2.C3,C4, C5, C6, C7 和 C8 一 一 都 是 4 字 上 生长 。 

CARDIC1 = 100, CARDIC2) = 200, CARDICH) = $0, CARDIC4} = 10, 

CARDICS = 10, CARDICE} = 1000, CARDIC7T} = 20, CARDICE) = SO00 

假设 对 于 每 列 C,， 列 的 值 从 1 到 CARDICO 均 习 分 布 。 

(a) 计算 下 列 的 统计 信息 。 解 释 你 的 推理 。 

(i) 计算 表 T 的 CARD 和 NPAGES，。 

{ii) 计算 C2, C3, C6 和 C7 的 COLCARD, LOW2KEY 和 HIGH2KEY. 

[ii 对 于 Cl1234X 和 C5678X 的 每 一 个 计算 FIRSTKEYCARD 和 对 十 
FULLKEYCARD 的 最 好 个 算 。 

[iv) 利用 FULLKEYCARD 和 关于 DB2 索 引 压 缩 的 合理 假设 (重要 )， 计 算 每 :个 
索引 的 NLEAF， 然 后 计算 每 一 个 的 NLEYELS 。 请 表明 计算 的 过 程 。 

fby es 考虑 下 列 查 询 ， 

select C10O from T Where C1 <= 10 and C2 between 100 
and 110 snd C3 = #: 
(i) 在 这 个 查询 的 EXPLAIN 后 ， 给 出 将 在 方案 表 中 看 到 的 相关 州 。 
(ii 为 了 回 管 (中 的 查询 ， 必 须 检索 的 索引 项 的 范围 是 什么 。 在 其 中 有 多 少时 于 
页 而 *? 我 们 可 以 使 用 顺序 预 取 吗 ? 对 于 这 步 ， 近 似 的 执行 时 间 昨 多 少 ? 
(iii) 计算 对 于 (中 的 查询 的 复合 谓词 的 过 滤 内 于。 
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{iv) 检索 到 多 少 行 ? 解释 为 什么 这 些 行 不 是 连续 的 ， 为 什么 不 能 使 用 顺序 预 取 。 
这 个 数据 页 面 存 取 步 又 的 执行 时 间 是 多少 ? 
(v) 指定 这 个 索引 步骤 ( 根据 (ii 和 (iv) ) 总 的 HD 和 执行 时 间 。 
(c) 对 于 两 种 方案 中 的 每 一 个 重复 在 (b) 中 相同 的 步骤 ， 这 两 种 方案 在 T 的 两 个 索引 上 土 
提出 。 对 于 查询 : 


select * from T Where C7? = 3 and Cl 一 99 and Ce = SH; 


这 些 方案 中 哪 一 个 的 MO 执行 时 间 代 价 较 低 ? 
9.5 上 绸 一 次 考虑 表 T 利 习题 9.4 中 的 相关 索引 和 列 。 


9.6 
hobbyx, 


a) 指出 下 列 搜 索 条 件 的 匹配 询 ， 同 时 说 明 如 果 所 有 谢 词 不 匹配 上 时， 匹配 会 中 止 于 
EB 
它 所 在 的 位 置 的 原因 。 
[ije select * from T where Cl = 7 and kz Y= 10] and C3 in (Cl.3) and ct# in 
{2.7 
【ij select * from T where Cl in (1,3,5) and C2 2 6 and C4 = 7:; 
fiiiye select * from T Where Cl <> 6 and C2 in tl1.3.5) and C3 ~ 5; 
(iv}y select * from T where Cl in (1.3.5) and C2 = 7 and C3 = 6 and C4 in 
(3,6.,8): 
(vs select * from T where CE = 7 and C2 in (1.5) and C3 1ike ‘%abe’ and C# in 
[24.7 


fwi) select * from T Where Cl in {1.3,5) and ktq > 3 and C3 ~- 7 and [2 = 6; 


Cv select * from T where Cl ~ C4 + 6 and ce in {1.3,5) and C3 = 6; 


tb) 在 给 出 下 列 问题 答案 时 ， 写 出 你 的 计算 过 程 。 
Ci)* (a) 部 分 中 他 查询 的 匹配 谓词 的 复合 过 滤 因 子 荐 多少? 


slect < from T where Cl = 7 and C2 Y= 101 and €3 1n (1.5) and Cd4 in (2 ,dd ,7): 


(ii) ”整个 查询 条 件 的 过 滤 因 子 是 什么 ? 
Qi) * 这 个 查询 索引 查找 存 取 的 页 面 的 数目 是 多 少 ? 
(iv) 假设 我 们 利用 筛选 谓词 ， 存 取 的 数据 真 面 的 数 明 是 多 少 ? 1/0 的 种 类 (R,S 
或 者 L) ? 
WD， 执行 这 些 VO 的 总 的 执行 时 间 ? 
在 这 个 习题 中 ， 假 设 prospects 表 具有 在 图 9-12 和 例 9.6.1 中 定义 的 索引 addrx， 
Aagex 和 incomex。 
{a)*， 说 明 在 什么 样 的 环境 下 ， 谓词 incomeclasee=10 在 多 重 索 引 扫 描 中 的 一 个 
MX 步骤 中 可 以 是 一 个 匹配 谓词 。 
(b) 在 多 重 索 引 扫 描 的 一 个 MX 步骤 中 ,使 用 谓词 age=40 是 否 可 能 ?说 明 原 因 。 
(c)。 在 多 重 索 3| 扫 描 的 一 个 MX 步骤 中 ， 使 用 谓词 age between 20 anq 39 是 
否 可 能 ? 
(d) 在 多 重 索 引 扫 描 的 一 个 MX 步骤 中 ， 使 用 谓词 age between 40 ana 44 是 
和 否 可 能 ? 
(el* 说 明 为 什么 在 一 个 多 重 索 引 扫 描 的 单个 MX 步骤 中 ， 使 用 价 辣 age in 
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(40,43,45) 是 不 可 能 的 ， 
人 日 有 设 有 一 种 方法 ， 创 建 -个 复合 谓词 具有 与 (e} 中 的 谓词 有 相间 的 效 案 机 及 可 以 
用 和 于 一 个 MX 步骤 序列 中 。 

9.7 对 于 下 面 的 练 汪 ， 把 在 9.5 节 中 定义 的 索引 mailx 加 人 到 习题 9.6 考 虑 的 索引 | 去 。 考 
虑 搜索 条 件 zipcode between 02139 and 03138 and incomeclass=10 aoa 
已 避 马 = 六 站 。 

(a)， 对 于 这 个 复合 谓词 ， 考 虑 mailx 上 的 一 次 匹配 索引 打 描 ， 并 在 方案 表 中 指出 相 
应 的 列 值 。 尤 其 ，MATCHCOLS 是 什么 ? 

(b) mai1x 上 的 扫描 产生 的 过 滤 因 子 古 什 么 ? 

(i) 如 果 没 有 使 用 一 个 RID 列 表 ? 
(ii) 如 果 使 用 一 个 RID 列 表 说 明 为 什么 有 这 样 的 区 别 。 
(cjs 在 人 b) 的 (ii 中 ， 我 们 可 以 把 这 个 mailx 的 扫描 看 做 是 一 个 多 重 索 引 存 取 中 的 。 
次 MX 扫描 。 在 那 种 情况 下 ， 我 们 也 可 以 使 用 其 他 索引 。 
00 在 incomeclass=10 上 的 我 们 可 以 执行 一 个 MX 步骤 叶 ? 
Qi) 表明 我 们 可 以 使 用 的 多 重 索 引 步 又 的 方案 表 。 
Gii) 在 本 情况 中 . 整个 搜索 条 件 的 过 涯 因 于 是 什么 ” 
(d) 对 于 (b) 的 介 中 表现 出 来 的 全 部 方案 ， 计 算 IO 执 行 时 间 :( 你 需 些 计算 堵 引 中 面 
和 数据 页 面 的 HO 时 间 )。 人 确信 你 使 用 了 正确 的 11O 类 型 一 一 随机 LO、 列表 项 地 WO 
或 者 顺序 预 取 UO )。 
(e)。 对 十 (c) 的 ( 记 中 出 来 的 全 部 方案 计算 它 的 VO 执 行 时 间 。 
9.8 假设 prospects 表 有 索引 aaarx， hobpbyx, incomex， genderx ( 例 9.6.3 
中 ) ,agex 和 和 mail1xos 
(alj。 在 多 重 索引 存 取 方 案 中 的 MX 步骤 中 ， 具 有 谓词 genaer= 'E 是否 可 能 ? 
(b) 考虑 查询 : 
select * from prospects where zipeode between J2139 
and 07138 and habby = chess' and age = 20; 

(。 用 一 次 maix 的 索引 扫描 解决 这 个 问题 是 否 可 能 。 指 出 于 面 的 匹配 霄 词 和 
筛选 请 词 。 

0iD 执行 多 重 索引 存 取 也 是 可 能 的 。 按 照 降 序 的 过 滤 因 子 放置 谓词 ， 袋 后 给 出 用 作 
MX 型 方案 的 方案 表 ， 其 中 最 小 的 过 滤 因 子 先 来 ， 我 们 一 次 尽量 保留 尽 可 能 少 的 
RD 列表 。 

(i)。 在 以 和 (说 部 分 检索 到 的 行 数 是 多 少 ? 涉及 到 多 少数 据 页 曾 ?” 使 用 了 硅 - 一 种 VO 
(R, [或 者 S ) ? 在 两 种 情况 下 ， 数 据 页 面 存 取 的 执行 时 间 是 多 少 ? 请 与 出 计算 
过 程 。 

9.9 对 于 下 列 查询 假设 索引 mai1x，hobbyx，incomex，agex。 考 虑 埋 击 : 


select * from prospects 
where zipcode between DP?159 and 04158 and 
(age = 40 or age = #44} and hobby = ‘tennis' 
and incomecslass = 了 


(a)。 说 明 为 什么 我 们 不 能 够 在 mai1lx 上 简单 地 使 用 一 次 匹配 索引 打 描 来 解决 所 有 这 
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些 谐 词 。 然 而 ， 我 们 可 以 用 短 选 谓词 执行 一 次 匹配 扫描 ， 筛 选 谓词 在 其 中 扮演 
了 过 滤 因 子 的 角色 。 分 析 这 样 一 个 方案 的 IO 执行 时 间 ， 包 揪 了 索引 IO 、 检 索 
到 的 行 数 以 及 它们 的 IO 类 型 。 给 出 全 部 的 执行 时 间 。 

(b) 现在 确定 多 重 索 引 存 取 方 案 以 匹配 尽 可 能 多 的 看 起 来 人 台 理 的 查询 谓词 。 首 先 按 
照 过 滤 因 子 增加 的 顺序 排列 谓词 。 计 算 每 个 谓 询 的 RID 获 取 的 索引 的 WO 代价 ， 
还 要 计 算 使 用 冬 一 个 谓词 后 的 过 滤 因 子 ， 以 及 谓词 是 否 自 己 偿 付 代价 。 紧 接着 
例 9.6.6 的 模式 。 在 这 个 计算 的 末尾 ， 写 出 像 图 9-18 那 样 的 多 步 索 引 的 方案 列 ， 
并 且 按 照 你 已 经 计算 的 顺序 和 任何 一 个 时 间 使 栈 中 现存 的 RID 列 表 的 数目 最 小 。 
这 个 儿 步 方案 的 总 的 执行 时 间 是 多 少 ? 

(cj ta) 和 (b)， 哪 一 个 占 优 ? 作为 一 个 通常 的 规则 ， 当 我 们 有 一 个 复合 索引 ， 它 只 在 
第 一 列 有 一 个 搜索 条 件 匹 配 ， 而 在 复合 索引 的 后 几 鹿 是 一 组 其 他 的 单列 索引 ， 
复合 索引 扫描 仍然 是 胜利 者 。 证 明 这 个 规则 。 

9.10 ” 督 虑 例 9.7,1]、 例 9.7.2 和 例 9.7.3。 我 们 有 表 TABL1 和 TABL2， 但 是 我 们 使 用 一 些 新 
的 列 和 和 索引。 有 “一 百 万 行 ， 每 行 200 字 节 ， 每 列 4 个 字 节 。 我 们 又 假设 在 索引 页 面 和 数据 页 面 
没有 浪费 的 空间 。 我 们 有 如 下 查询 ; 

salect * from TABL]I Tl, TASL2 Ta 


Where Ti.c6 = 5 and TL 一 Te 
and T2.C9 = 6; 


假定 我 们 有 索引 C6X，C7X，C8X 和 C9X; FF (TI.C6= 常 数 ) = 1/20; FF (T2.C9= 常 数 ) 
= 17400; 列 T1.C7 的 值 从 1 到 200 000 均 句 分布; T2.C8 的 值 岂 是 从 1 到 200 000 均 与 分 布 ; 
TILC7 和 T2.C8 的 值 没 有 通过 行 数 或 其 他 什么 有 任何 关联 。 它 们 是 互相 独立 的 随机 的 。 
(aj。 推 导 从 这 个 查询 得 到 的 行 的 期 望 数值 。 
(b) 考虑 这 个 查询 ， 有 三 种 可 能 的 方案 : 0) 最 套 循 环 连接 ， 其 中 T1 是 外 表 ，G 峰 套 循 
环 连接 ， 其 中 T2 是 外 表 (T1 同 T2 是 不 问 的 ) Gi 让 归并 连接 。 对 于 每 一 种 方案 计算 出 
总 的 OQ 时间， 并 且 得 出 哪 一 种 方案 更 好 。 在 归并 连接 的 情况 下 ， 其 中 排序 是 必要 
的 ， 很 定 不 多 于 50 页 的 一 次 排序 不 需要 TD， 但 是 多 于 $0 页 时 ， 每 一 页 面 必 须 蓝 写 
出 然后 再 读 人 ， 使 用 顺序 WO 写 但 是 用 随机 LO 读 入 。( 这 样 做 的 原因 是 由 磁盘 排序 
算法 决定 的 。 ) 
9.11 ”在 例 9.8.1 中 ,假设 2000 字 节 长 的 行 的 序列 ， 两 行 占据 一 页 ， 首 过 下 列 值 依 次 排序 ， 
下 面 的 值 代 表 了 行 的 最 初 顺 序 。 
67 1245 84 58 29 767918139226596332877454134132159 
(a)* 就 像 在 例 9.8.1 中 那样 ， 在 这 些 数字 上 搜 行 一 个 两 路 归并 排序 。 显 示 出 所 有 的 中 
间 结 果 。 
{b) 重复 (a) 部 分 的 排序 ， 现 在 使 用 一 个 二 路 归并 排序 。 
(c) 现在 假定 给 出 的 行 长度 是 4000 字 节 ， 所 以 -- 行 占据 一 页 。 在 这 些 数 字 上 执行 四 
路 归并 排序 。 
9.12 ”问答 下 面 的 有 关 集 合 查 询 基 淮 程 序 的 问题 ， 在 所 有 情况 下 都 是 指 DB2 浏 量 。 对 于 下 
面 的 每 - -个 WHERE 子 名 你 期 望 可 以 从 BENCH 表 中 检索 到 多 少 行 ? 
(a}j* FE2=2 AND Kl10=7, 


带 9 葛 这 六 处 理 455 


(bj KSEQ BETWEEN 400000 AND 410000 OR KSEQ BETWEEN 480000 
AND SOO0000., 

{c)*， 图 9-34 中 的 谓词 列表 序列 的 1 到 4 

(gj (fi 在 QI 中 ,假设 所 有 的 DB2 预 取 I/O 都 是 顺序 需 取 ， 在 Kg2 情 况 下 ，BO 化 费 多 长 
时 间 ? 在 K10 的 情况 下 呢 ? 
fii) 论证 在 K2 情 沈 下 ，DB2 是 与 CPU 相关 的 。 

(iiiy 在 K10 情 部 下 ， 有 多 少 页 面 被 读 和 内存? 给 出 执行 该 查询 方案 时 有 多少 页 面 
必须 被 看 到 的 详细 情况 。 

(c)* 考虑 查询 Q2A。， 在 32 页 的 块 中 ， 一 些 倩 况 很 明显 地 使 用 顺序 其 取 ， 指 出 一 种 这 样 的 情 
况 。 顺 序 预 取 IO 莫 用 多 长 时 间 。 该 种 情况 如 何 同 我 们 已 经 使 用 的 经 验 规则 协调 蕊 来 ? 

(了 ) 考虑 查询 Q4B， 详 细 细 和 在 图 9-35b 中 ，。 

(i 在 条 件 序列 5 ~ 9 中 使 用 了 什么 索引 ? 

{ii) 在 组 全 这些 索引 后 ， 给 出 你 期 望 从 表 中 检索 到 行 数 ， 

(i) 使 用 飞镖 投 同 空位 的 公式 来 计算 在 (i 让 中行 上 的 负面 数 ， 把 这 个 数 日 同 在 图 
9-35b 中 报道 的 收 大 内存 的 页 面 数 做 比较 。 

(g)。 在 查询 Q6B8 中 ， 在 K100 情 况 下 ， 执 行 : 次 计算 ， 解 释 你 的 推理 ， 估 算 检 索 到 
行 {被 连接 的 ) 的 总 数 。 怎样 把 这 个 数目 同 实际 检索 到 的 数 日 进行 比较 ?你 
可 以 在 什么 地 方 发 现 那 些 数 日 ?”) 

9.13 考虑 下 列 在 集合 查询 基准 程序 的 BENCH 表 上 的 查询 。 

select Bl.KSEQA,. Ba_KSEQ from BENCH Bl, BENCH B2 
Where BT ,KRLOO = 22 and Bl .KR250k = B2.KIOOK and B22.K25 = 19: 

(a)。 计 算 你 期 望 看 到 的 检索 的 行 数 。 给 出 你 的 计算 过 程 ， 

(by)*， 计 算 在 两 种 不 同 的 可 能 的 散 套 循环 连接 圭 的 执行 时 间 ， 并 说 明 哪 种 方案 更 好 。 

9.14 考虑 下 列 在 集合 查询 基准 程序 的 BENCH 表 上 的 查询 。 


delect Bl.kKSEQO, B2,KSEQ from BENCH Bl1, BENCH B82 
where BL.KIOO = 22 and Bl .KSOK = B2, KSOK and B2,K100 = 19: 


(a) 计算 你 期 望 看 到 的 检索 的 行 数 。 给 出 计算 过 程 。 

(b) 计算 用 嵌 套 循环 连接 得 出 的 WO 的 执行 时 间 两 种 谋 套 循环 连接 的 时 间 是 一 样 的 ) 
和 归并 连接 得 出 的 FO 的 执行 时 间 。 给 出 计算 过 程 ， 并 说 明 哪 种 方案 更 好 。 

9.15 考虑 BENCH 表 和 种 它 的 索引 。 在 下 面 的 习题 中 ， 假 设 表 BENCH 和 和 所 有 的 索引 被 以 
100% 满 的 页 面 装载 。 在 紧 接着 的 计算 中 使 用 DB2 的 标准 假设 ， 并 给 出 计算 计 程 。 

(a)， 运行 RUNSTATS 之 后 ， 给 出 一 个 Select 语 名 来 从 相应 的 DB2 系 统 目 录 表 中 检索 
BENCH 表 上 的 行 所 在 的 数据 页 面 的 数目 。 

(b) 计算 你 期 望 寻找 的 数据 页面 的 数目 ， 慨 设 页 面 是 100 名 装载 满 的 。 

(cj 。 在 页 面 是 100 久 满 的 假设 下 ， 计 算 你 期 望 在 K2X 索 引 中 找到 的 叶子 页 面 的 数目 。 
不 时 忘记 叶子 层 索 引 压 缩 。 

(d 假设 我 们 删除 在 BENCH 中 KSEQ-=300 000 的 行 。 为 了 删除 该 行 ， 我 们 可 以 直接 进 
大 存 K2x 中 的 索引 项 ， 这 是 否 正 确 ? (也 就 是 ,我们 是 否 有 一 种 可 以 在 且 录 结构 中 
寻找 项 的 方法 ? ) 针对 你 的 答案 给 出 原因 【如 果 可 能 的 话 ， 引 用 在 文章 中 的 文献 ). 


第 10 章 更 新 事务 


在 5.4 节 我 们 介绍 了 事务 的 基本 概念 。 现 在 我 们 通过 一 些 定义 开始 回顾 一 下 前 面 的 内 容 。 


定义 10.1 事务 是 数据 库 握 供 的 -- 种 手段 ， 通 过 这 一 手段 ， 应 用 程序 员 将 一 系列 的 数据 库 
操作 组 合 在 一 起 作为 一 个 整体 以 便 数据 库 系统 提供 一 组 保证 ， 也 就 是 事务 的 ACID 性 质 (本 市 
稍 后 会 讲 到 )。 当 组 成 事务 的 操作 同时 包括 读 操 作 和 更 新 操作 时 ， 表 明 应 用 程序 员 币 望 对 数 扼 
进行 一 致 的 状态 转 接 。 如 果 这 些 操作 仅仅 包括 读 操作 ， 表 明 程 序 员 只 希望 得 到 当前 数据 的 一 
致 视图 。 师 

在 标准 SQL 中 没有 Begin Transaction 这 样 的 语句 ; 事实 上 当 系 统 处 理 进 程 中 没有 活动 的 
事务 时 ， 一 个 事务 就 可 以 开始 ， 并 且 访 问 数 据 的 SQL 语句 (如 Select，Update ，Insert， 了 Delete 
等 } 被 完成 。 而 当 事 仍 处 于 执行 状态 时 ， 它 所 作 的 任何 更 新 对 并 行 用 户 而 言 都 是 不 可 见 的 ， 
并 且 数 据 读 不 能 被 更 新 。 在 标准 SQL 中 关于 卓 务 的 执行 有 两 条 语句 。 第 一 条 语句 是 Coimmit 
语句: 

和 591 commit work: 
程序 员 可 以 使 用 这 条 语句 通知 系统 当前 事务 已 经 成 功 完成 ; 事务 所 做 的 所 有 更 新 在 数据 库 中 
将 永久 地 保存 下 来 并 对 并 行 用 户 可 见 。 

第 二 条 和 事务 执行 有 关 的 语句 是 Rollback 语 句 : 

exec Sql rollback work: 

这 条 语句 指出 当前 事务 执行 失败 ; 事务 所 做 的 所 有 修改 将 被 撤销 ， 被 修改 的 数据 将 恢复 
到 妖 改 之 前 的 版 本 并 对 并 行 用 户 再 次 可 见 。 无 论 是 系统 发 出 的 还 是 程序 发 出 的 加 滚 操作 都 将 
终 上 上 一 个 事务 ,我 们 通常 称 之 为 异常 中 止 。 

在 5.4 节 中 我 们 只 是 简单 介绍 了 事务 的 概念 ， 以 引出 在 应 用 程序 中 引入 Commit 和 Rollback 
语句 的 必要 性 ， 以 及 当 事 务 发 生死 锁 时 异常 中 止 事务 的 必要 性 。 本 章 中 我 们 将 更 深入 地 了 解 
关于 事务 的 这 些 概念 ， 即 便 如 此 ， 本 章 也 只 是 对 这 一 复杂 而 重要 的 领域 (事务 ) 的 一 个 介绍 
而 已 。 当 前 ， 许 多 数据 库 系 统 的 软 硬 件 提供 商 就 数据 库 的 事务 处 理 系 统 专 门 成 立 开 发 小 组 ， 
甚至 在 不 同 的 地 点 进行 开发 。 在 第 8 章 和 第 9 章 提 到 的 ， 诸 如 以 支持 有 效 查 询 处 理 为 目标 的 数 
据 库 系统 的 那些 典型 特性 ， 与 支持 事务 处 理 相 比 还 存在 很 大 的 盖 跑 ， 所 以 你 在 本 章 要 做 好 学 
习 更 多 知识 的 准备 。 

从 20 世 纪 50 年 伐 开始， 人 们 开始 用 事务 的 概念 来 解决 开发 早期 的 大 型 数据 库 应 用 过 程 
中 系统 设计 所 面临 的 一 系列 问题 。 银 行 的 日 常 业务 就 是 这 样 的 一 个 例子 ， 必 须 允 许 许多 出 
纳 员 同时 处 理 多 个 顾客 的 读 取 利 更 新 。 人 入 处 理 这 样 的 应 用 的 过 程 中 ， 早 期 的 开发 人 员 必 须 
面 对 以 下 的 问题 。 

(1) 产生 不 一 致 的 结果 

当 出 现 以 下 情况 时 我 们 将 如 何 钼 理 ? 一 个 应 用 程序 正在 从 一 个 账户 向 田 一 个 账 族 转 一 笔 
钱 时 { 这 两 个 账户 是 两 条 不 同 的 记录 ， 通 常 处 于 磁盘 的 不 同 页 而 上 )。 当 第 一 个 账户 已 经 将 这 
笔 钱 从 它 的 余额 中 扣除 ， 并 且 已 经 记录 到 磁盘 上 ， 这 时 由 于 电源 故障 使 得 系统 般 吐 。( 必须 注 
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意 的 是 两 次 磁盘 更 新 操作 必定 有 一 个 操作 是 先 做 的 ， 毅 泪 通 常 发 生 在 执行 第 二 次 磁盘 更 新 操 
作 之 前 。) 当 我 们 试图 进行 系统 恢复 时 ， 我 们 的 应 用 程序 再 也 不 能 获得 当时 的 执行 还 辑 〈 所 有 
的 内 存 内 容 已 经 天 兴 , 包括 程序 变量 和 进行 流程 控制 的 寄存器 )。 唯一 水 式 的 知情 嘻 在 磁盘 上 ， 
而 应 用 程序 只 是 修改 了 一 个 账户 中 的 金额 ， 因 此 破坏 了 两 个 账户 的 总 额 平 衡 . 

(2) 并 发 执行 的 销 误 

如 果 不 对 并 发 事务 的 读 写 记录 进行 控制 ， 并 发 事务 的 执行 可 能 以 很 多 方式 互相 干扰 。 这 
些 干 扰 中 的 一 种 方式 就 是 不 一 致 分 析 。 假 定 出 纳 员 1 正在 从 一 个 顾客 的 账户 A 向 该 顾客 的 加 外 
一 个 账户 B 转 一 笔 钱 ， 市 出 纳 员 2 试图 将 该 顾客 的 这 两 个 账户 的 余额 相 加 进行 -- 次 信用 测试 。 
如 果 代 表 出 纳 员 1 的 应 用 将 转账 的 金额 从 账户 A 中 扣除 了 ， 而 账户 B 还 没有 如 二 这 笔 钱 。 这 时， 
代表 出 纳 员 2 的 应 用 将 该 顾客 的 两 个 账户 的 金额 进行 了 相 加 操作 ， 那 么 出 纳 员 2 看 到 的 将 是 比 
这 位 顾客 的 实际 存 蒜 要 少 的 金额 ， 由 此 可 能 导致 这 位 着 客 不 能 通过 信用 测试 。 

(3) 关于 何 时 更 新 的 数据 会 变 为 持久 化 的 不 确定 性 

回想 一 下 ， 为 了 减少 磁盘 的 访问 次 数 (LO )， 我 们 通常 将 常用 的 和 页面 存放 在 内 存 中 这 
意味 着 对 于 一 条 经 常 要 用 到 的 记录 会 在 内 存 中 放置 很 长 一 段 时 间 ， 比 如 保存 银行 其 个 分 行 的 
余额 的 记录 。 就 像 我 们 在 问题 1 中 提 到 的 那样 ， 当 崩溃 发 生 时 我 们 只 能 找到 已 经 写 到 柚 失 上 的 
内 容 。 因 此 大 上 去 似乎 我 们 有 以 下 两 种 选择 ， 一 种 方法 是 -~ 旦 有 收 改 操作 发 生 束 将 缓冲 的 记 
录 全 部 写 回 到 磁盘 上 去 【如 果 这 样 做 ， 我 们 根本 不 能 通过 缓冲 机 制 来 节省 磁盘 IO 操作 )， 为 
外 一 种 方式 是 发 生 和 修改 操 作 时 不 做 频繁 的 写 回 【在 这 种 方式 下 ， 当 用 户 时 从 账 尸 中 取款 时 低 
感到 紧张 ， 因 为 系统 可 能 在 取款 信息 被 记录 下 来 以 前 崩溃 )。 对 于 每 个 记录 改变 没有 完成 磁盘 
写 操作 ， 我 们 能 够 相信 更 新 被 记录 下 来 了 吗 ? 

为 了 解决 这 些 问题 ， 系 统 分 析 员 提出 了 事务 的 概念 【尽管 这 些 想法 直 提 20 世 纪 70 年 代 才 
被 规范 化 )。 针 对 以 上 这 些 有 具体 的 问题 ， 系 统 分 析 员 将 事务 定义 为 对 数据 库 的 一 串 读 写 操作 ， 
这 些 操作 组 成 一 个 逻辑 单位 。 比 如 多 个 账户 之 间 的 转账 操作 包括 读 ， 也 包括 写 }， 上 骨 如 包括 
案 个 账户 的 信用 检查 操作 ( 只 也 会 一 系列 的 讯 操作 )。 应 用 程序 员 决 定 怎 样 将 一 些 讯 取 和 更 新 
操作 逻辑 地 组 成 一 个 事务 ， 接 着 数据 库 系统 通过 提供 以 下 四 个 保证 来 解决 上 面 所 列 的 各 种 问 
题 。 这 四 个 保证 我 们 称 之 为 ACID 保证 或 ACID 性 质 。ACID 是 四 个 属性 的 缩写 : Atomicity ( 原 
子 性 )，Consistency ( . . 致 性 }，Isolation {隔离 性 ) 和 Durability ( 持久 性 ). 

原子 性 ”事务 的 这 一 性 质保 证 事务 包含 的 一 组 更 新 操作 是 原子 不 可 分 的 〔 取 原子 这 一 单 
词 的 原来 意思 ， 原 子 训 变 被 发 现 之 前 )。 也 就 是 说 ， 这 些 更 新 操作 对 于 数据 库 而 言 要 么 全 做 要 
么 全 不 做 ， 不 能 部 分 地 完成 。 这 一 性 质 即便 在 系统 崩溃 之 后 仍 能 得 到 保证 ( 参考 下 面 要 提 到 
的 持久 性 )。 一 个 称 之 为 数据 库 恢 复 的 过 程 将 在 系统 崩溃 后 执行 ， 用 米 恢 复 或 撤销 系统 朋 沉 时 
处 于 活动 状态 的 事务 对 数据 库 产生 的 影响 ， 从 而 保 让 事务 的 原子 性 。 因 此 问题 1 一 一 产生 不 一 
致 的 结果 ， 就 可 以 得 到 和 解决。 系统 在 对 磁盘 上 的 任何 实际 数据 微 出 修改 之 前 都 会 先 将 关于 眉 
改 操作 本 身 的 信息 记录 到 磁盘 上 。 当 发 生 贿 溃 后 ， 系 统 就 能 根据 这 些 操作 记录 掌握 当时 该 事 
务 处 于 何 种 状态 ， 以 此 决定 是 撤销 该 事务 所 做 出 的 所 有 修改 操作 从 而 撤销 对 数据 库 的 影 啊 ) 
还 是 将 那些 林 在 数据 库 中 懒 出 真正 修改 的 操作 重新 执行 (这 样 事务 就 成 功 完 成 ). 

一 致 性 这 是 数据 库 系 统 提供 的 另外 一 个 事务 属性 ,我们 将 在 稍 后 定义 。 对 于 一 致 性 ,我 
们 不 会 像 ACID 的 其 他 几 个 性 质 那样 突出 地 介绍 ， 因 为 一 致 性 在 逻辑 上 不 是 独立 的 。 事 实 上 ， 
一 致 性 由 事务 的 另外 一 个 更 基本 的 性 质 一 -隔离 性 表 水 。 
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隔离 性 ”事务 是 硼 高 的 意味 着 仅 当 两 个 事务 不 处 于 并 发 状态 ( 即 它 们 的 操作 不 是 交错 的 ) 
时 ， 其 中 一 个 事务 对 另 一 个 事务 才 有 影响 。 这 一 人 性质 的 男 外 一 种 称 法 为 可 囊 行 性 ， 也 就 是 党 
系统 允许 的 任何 交错 操作 调度 等 价 于 某 一 个 囊 行 调度 。 串 行 调度 的 意思 是 每 次 调度 -个 事务 ， 
在 一 个 事务 的 所 有 操作 没有 结束 之 前 ， 另 外 事务 的 操作 不 能 开始 。 由 于 性 能 原 困 ， 我 们 壳 要 
进行 交错 操作 的 调度 ， 但 我 们 也 而 望 这 些 交 错 操作 的 调度 的 效果 和 某 一 个 串 行 调度 是 - ' 敏 的 - 
数据 库 对 事务 提供 的 这 一 保证 就 能 很 好 地 解决 问题 2 一 一 并 发 执行 导致 的 错误 。 就 像 我 们 在 5.4 
节 中 所 到 的 那样 ， 商 业 数 据 库 系统 中 对 这 一 性 质 的 实现 是 通过 对 事务 的 数据 访问 对 象 加 适当 
的 锁 从 而 排斥 其 他 事务 的 对 同一 数据 对 象 的 并 发 操作 。 

持久 性 系统 提供 的 这 一 保证 要 求 : 当 事 务 发 出 提交 语句 后 系统 返回 到 程序 兆 输 时 ， 必 须 
保证 该 事务 是 可 恢复 的 。 例 如 ， 自 动 柜 贡 机 《ATM ) 在 向 客户 支付 一 笔 钱 时 ， 束 不 用 担心 雷 
失 冤 户 的 取款 记录 了 。 也 就 是 说 第 3 个 问题 可 以 得 到 解决 了 。 我 们 称 数据 库 提 供 的 这 一 保证 为 
持久 性 ， 即 事务 产生 的 影响 是 持久 的 ， 哪怕 系统 崩 当 。 正 如 我 们 在 讲述 原子 性 时 提 到 过 的 那 
样 。 系统 通过 做 记录 来 握 供 这 一 保证 。 同 时 ， 在 修改 大 其 记录 的 情况 下 ， 为 了 保证 事务 的 这 
一 性 质 可 以 减少 大 量 的 磁盘 IO 次 数 。 系 统 可 以 在 一 次 磁盘 写 操作 中 包括 多 条 关于 记录 更 新 操 
作 的 记录 和 信息， 而 这 些 记录 更 新 操作 本 身 可 能 需要 对 不 同 的 磁盘 页 面 进行 操作 ， 久 而 需要 多 
次 的 磁盘 操作 才能 将 各 条 记录 写 到 各 自 的 磁盘 页 面 上 去 。 事 实 上 ， 即 使 这 些 磁 盘 页 面 都 已 经 
写 回 到 磁盘 上 ， 关 于 这 些 操作 的 日 志 信 息 仍 然 是 必要 的 ， 这 -点 我 们 会 在 稍 司 做 出 解释 。 

显然 ， 原 子 性 和 持久 性 对 于 只 读 事 务 而 言 是 平凡 满足 的 《由 于 没有 更 新 操作 )。 在 这 种 情 
形 下 ， 唯 一 值得 关 广 的 事务 性 质 是 隔离 性 ， 也 就 是 必须 保证 只 读 事 务 该 到 的 行 不 包 人 洁 未 所 区 
事务 修改 的 数据 。 如 果 人 允许 读 取 未 提交 事务 修改 过 的 数据 ， 那 么 就 有 可 能 产生 不 一 致 的 问题 ， 
比如 ， 当 出 纳 员 2 试图 对 账户 A (此 时 代表 出 纳 员 1 的 末 提 交 事务 已 经 对 账户 A 进行 了 修改 ) 和 
账户 B (代表 出 纳 员 1 的 未 提交 事务 正在 对 该 账户 进行 更 新 操作 ) 进行 求 和 时 ， 就 会 产生 不 一 
致 问题 。 事 务 的 以 上 三 项 保证 《性 质 ) 一 一 原 手 性 、 持 和 久 性 和 坑 离 性 一 需要 进行 深入 的 学 习 ， 
正 为 它们 之 间 的 联系 比较 紧密 、 复 杂 。 在 10.1 节 我 们 学 习 了 凤 离 性 ( 通常 也 称 之 为 可 串 行 性 )。 
在 后 面 的 章节 我 们 将 学 习 原 子 性 和 持久 性 。 

隐 含 在 到 离 性 中 的 事务 的 另外 一 个 性 质 就 是 一 致 性 。 我 们 曾经 在 问题 2 中 谈 到 不 -- 致 问题 
时 担 到 过 。 一 臻 性 是 一 种 以 一 臻 性 规则 为 基础 的 逻辑 属性 ， 比 如 “在 转账 过 程 中 ， 钞 所 不 能 
多 ， 也 不 能 少 "。 这 样 的 一 条 规则 对 于 程序 员 来 说 就 是 一 个 强制 的 规定 ， 也 就 是 说 执行 转账 任 
务 的 事务 结束 时 不 能 造成 账户 金额 的 不 平衡 ， 这 样 程序 的 执行 逻辑 才 是 符合 要 求 的 我 们 总 
是 假定 在 满足 隔离 性 时 程序 的 逻辑 是 服从 一 致 性 规则 的 )。 事 务 的 一 致 性 属性 要 求 在 事务 并 发 
执行 的 情况 下 事务 的 一 致 性 仍然 是 满足 的 。 然 而 ,事实 证 骨 事 务 的 隔离 性 已 经 足以 保证 这 一 
点 ， 因 为 事务 的 隔离 性 能 够 保证 并 发 执行 的 事务 仅仅 当 操 作 互 不 交错 时 才能 互相 影响 。 很 明 
显 ， 如 果 在 隔离 情况 下 程序 逻辑 是 符合 一 致 性 要 求 的， 那么 在 给 定 了 隔离 性 的 保证 后 ,在 事 
务 并 发 执行 的 情况 下 ， 一 致 性 仍 将 得 到 保证 。 央 此 在 接 下 去 的 内 容 中 我 们 将 不 打算 专门 讲述 
数据 库 对 事务 提供 的 这 一 性 质 。 值 得 注意 的 是 ,对 数据 库 应 用 的 一 致 性 测试 也 是 对 该 应 用 的 
隔离 性 实现 情况 的 很 好 测试 。 我 们 将 在 10.10 节 的 TCP-A 基 准 测 试 中 看 到 这 一 点 。 

在 接 下 来 的 章节 中 ， 我 们 将 用 定义 和 定理 的 形式 、 以 非常 严格 的 方法 来 重新 考察 事务 的 
各 个 概念 。 第 2 章 介绍 关系 模型 的 概念 时 以 及 第 5 章 学 习 数 据 库 设 诗 时， 我 们 都 已 经 采用 了 同 
样 的 方法 。 这 样 做 的 原因 是 ,这 些 概 念 有 一 定 的 难度 ， 而 这 种 严格 的 方法 恰恰 是 最 为 明确 、 
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可 行 的 交流 思想 的 教学 方法 。 这 样 做 的 另外 一 个 原因 是 历史 原因 : 自从 20 世 纪 50 年 代 提 出 事 
务 的 概念 以 来 ， 关 于 事务 研究 的 一 些 文 章 都 是 在 严格 的 计算 机 科学 学 报 上 发 表 的 ， 尤 其 是 20 
世纪 70 年 代 开 始 。 

人 们 曾经 期 望 在 20 世 纪 50 年 代 开 始 计划 开发 的 事务 系统 给 他 们 带 来 数 士 亿美 元 的 软 硬 件 
销售 额 (一 份 与 银行 以 及 数 百 万 被 无 数 账本 压 得 眶 不 过 起 来 的 银行 雇员 的 合同 )。 现 在 每 年 工 
业界 六 在 事务 系统 上 的 资金 在 六 十 亿美 元 左右 。 自 然 开 发 这 些 系 统 也 为 国家 和 和 公司 带 来 了 可 
观 的 收益 。 当 计算 机 公司 投资 开发 这 些 系统 时 ， 他 们 自然 希望 程序 实现 过 程 用 到 的 一 些 基本 
的 概念 到 时 不 会 引起 令 人 婚 坟 的 错误 。 公 司 的 高 层 管理 人 员 仔 细 聆 听 着 系统 的 设计 人 员 和 开 
发 人 员 的 介绍 ， 他 们 想 知 道 如 何 才能 保证 这 些 投资 数 百 万 美元 的 项 目 最 终 能 产生 一 个 如 其 所 
定 称 的 那样 的 工作 系统 。 任 何事 情 都 将 围绕 这 一 问题 展 。 我 们 是 台 已 经 了 解 了 所 有 可 能 出 
现 的 问题 ( 是 否 仅 仅 会 出 现 以 上 所 列 的 三 个 问题 呢 ) ? 这 些 方法 能 够 解决 我 们 知道 的 所 有 问 
题 吗 ? 是否 有 别 的 问题 我 们 还 没有 考虑 到 ? 我们 如 何 确 信 这 一 点 ? 

严格 的 证 明 可 以 用 来 回答 这 些 问题 ， 至 少 在 这 一 领域 这 些 问题 可 以 简单 地 公理 化 。 当 然 
先 出 现 的 并 非 是 学 报 的 文章 。 一 组 早期 的 粗糙 但 实用 的 原理 形成 之 后 ， 第 一 代 的 事务 系统 就 
建立 起 来 了 了。 由 于 这 些 原 理 仍 处 于 发 展 阶段 ， 这样 在 接 下 去 的 一 段 时 间 里 一 批 有 影响 的 文章 
也 相继 发 表 ， 这 些 文章 的 作者 往往 是 以 前 很 少 在 学 报 上 发 表 文 章 的 编程 人 员 。 这 些 文章 构成 
了 事务 研究 领域 的 菇 础 ， 并 规范 了 各 种 假设 和 问题 ， 证 明了 解决 方法 中 应 用 的 原理 。 这 些 原 
理 的 大 和 多数 仍 被 现在 的 商业 系统 所 采用 。 


10.1 事务 经 历 


当 人 允许 两 个 或 多 个 用 户 对 数据 库 同时 执行 读 写 的 交错 操作 时 就 会 出 现 事务 隔离 性 的 要 求 。 
在 此 处 ， 当 我 们 谈 到 旋 写 操作 时 ， 我 们 是 指 最 原始 意义 上 的 操作 ; 而 面向 集合 的 SQL 语句 正 
是 由 这 些 棵 作 组 成 的 。“ 读 ”是 指 访问 一 个 数据 项 ， 比 如 数据 库 表 中 的 某 一 行 或 者 数据 库 的 某 
个 索引 项 ,“ 写 ”是 指 对 数据 库 中 某 个 数据 项 的 改变 。 我 们 通常 称 这 两 个 哥 作 为 读 和 写 ， 而 不 
是 读 和 更 新 ， 因 为 “更 新 ”一 词 在 数据 库 SQL 语 名 中 有 丰富 的 隐 含 意义 (通常 是 指 读 操 作 之 
后 ， 又 根据 所 读 的 内 容 进 行 一 次 号 操作 )。 

1. 数据 库 中 基本 的 原子 读 写 操作 

我 们 使 用 记号 R(A) 表 示 事 务 对 数据 项 A 的 一 次 读 操 作 ， 其 中 T, 表 示 该 事务 ，, 是 数据 库 系 
统 给 出 的 标识 号 。 现 在 我 们 来 考虑 拥有 两 个 属性 uniqueida (该 属性 唯一 标识 一 个 数据 项 ) 
和 val (事务 中 要 读 写 的 值 ) 的 一 张 表 T1。 那 么 R{A) 可 以 表示 为 事务 T 执 行 以 下 的 SQL 语句 

select val into :pgmyall from Tl where uniqueid 一 A;: 

我 们 还 使 用 记号 W,(B) 表示 事务 了 对 数据 项 B 的 一 次 写 操作 ; ”操作 W,(B) 也 可 以 表示 为 事 
务 T 执 行 以 下 的 SQL 语 休 ; 

update Tl set yal = ;pgmval2 where uniquetd = B: 

当然 这 些 例子 有 些 简 单 ， 上 面 的 Select 和 Update 语 句 可 能 包含 对 多 个 数据 项 的 操作 。 在 两 
条 SQL 语 句 中 都 使 用 了 WHERE 子 名 谓词， 其 作用 是 根据 给 出 的 uniqueid 的 值 来 确定 要 操作 
的 T1 中 的 行 。 我 们 可 以 将 读 取 这 个 谓词 信息 (无 论 是 否 通过 索引 ) 看 做 读 取 它 右边 的 一 个 数 
据 项 。 
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在 多 个 事务 读 写 同一 个 数据 项 的 过 程 中 必须 保证 一 点 ， 那 就 是 -… 个 事务 对 某 个 数据 项 的 
读 操 作 不 能 在 另 一 个 事务 对 同一 数据 项 正在 进行 写 操作 时 进行 ， 因 为 这 时 该 数据 项 可 能 是 不 
一 到 的 (比如 一 个 长 的 学 符 串 }。 同 样 ， 两 个 写 操 作 也 不 能 相互 干扰 产生 不 --- 致 。 我 们 称 RA) 
和 W(B) 是 原子 操作 ， 是 指 我 们 可 以 将 它们 看 做 是 在 任意 两 个 数据 库 的 操作 之 间 星 间 完 成 的 。 
这 和 我 们 在 前 面 提 到 的 事务 的 原子 性 是 完全 不 同 的 概念 。 

需要 注意 的 是 我 们 在 记号 RA) 和 WAB) 中 并 没有 指出 实际 值 ; 但 是 如 果 需 要， 我 们 可 以 将 
这 两 个 记号 扩展 为 RA,vall) 和 和 W,(B,val2)。 读 写 的 值 作为 第 二 个 参数 (与 va11l 和 和 va12 相 关 的 
列 名 不 用 给 出 )。 通常 第 二 个 参数 可 以 定义 为 常量 ， 比 如 ，R,(A,50}y 和 Wi(B.,80)。 

2. 谓词 读 操 必 

在 前 向 我 们 提供 的 Select 和 Update 计 名 的 例子 可 能 是 最 简单 的 。 事 实 上 数据 库 读 写 操 作 可 
以 表现 得 非常 复杂 。 比 如 ， 读 写 操 作 可 以 包括 一 行 中 的 多 个 列 ， 而 不 仅 仪 是 只 对 唯 -- 标 识 行 
的 单个 列 的 操作 【尽管 表 T1 确 实 只 有 一 个 相关 的 列 }。 再 比如 事务 T, 可 以 在 一 组 行 上 执行 相应 
的 SQL 语句 ， 而 不 其 是 单行 : 


[TD update tbl set yal = 1.15*val 
Where unidqueid between :low and :high; 


在 这 个 例子 中 这 条 语句 将 保证 天 量 不 同 的 读 和 写 操作 。 事 务 T, 首 先 执行 谓词 读 操 作 一 一 
R,(PREDICATE)， 读 出 那些 满足 WHERE 了 于 凶 中 给 出 的 条 忻 的 行 ， 即 行 的 uniqueia 的 值 介 十 
程序 变量 :1ow 和 :high 之 间 的 行 。 当 然 在 检查 这 一 条 件 时 需要 采取 一 些 必要 的 方法 。 比如 遂 
过 索引 查找 。[10.1.1] 的 Update 语 句 在 事务 T, 中 可 以 如 下 表示 : 


Rlipredicate: unigueid between :iow and :high) 


获得 满足 条 件 的 行 的 列表 后 ，[10.1.1] 中 的 Update 语 句 就 可 以 执行 一 系列 的 读 写 操作 ， 
先是 Ri(uniqgueidy,Yaluew) 操 作 ， 然 后 是 W,(uniqueidi,1.15*yalue.)， 其 中 uniqgueid; 介 于 :low 
和 :high 之 间 。 

3. 事务 的 读 写 经 历 

在 接 下 去 的 内 雁 中 ， 我 们 假定 每 个 用 户 进程 都 在 事务 中 执行 原子 读 写 操作 。 稍 后 我 们 也 
会 考虑 谓词 读 问 题 。 作 为 一 个 执行 这 些 读 写 操作 的 应 用 ， 当 进程 中 的 前 一 个 事务 结束 时 ， 数 
据 库 系统 的 事务 管理 器 层 (参见 图 10-1 ) 解释 下 -个 事务 第 -个 读 或 写 操 作 ， 并 赋 以 事务 号 上 
现在 ,我们 假定 任何 事务 包含 的 数据 库 活 动 都 可 以 视 为 一 系列 的 读 操作 ( R,(A}) 写 操 作 
{W(B) ) 以 及 提交 语句 发 出 的 提交 如 作 { C, 和 回流 语句 或 由 于 死 锁 《 我们 将 在 10.4 节 阐述 ) 
发 出 的 回流 操作 《Ai )。 此 处 我 们 忽略 整 行 的 揪 人 和 删除 。 在 我 们 的 模型 中 ， 建 操作 代表 事务 
所 有 的 信息 获取 操作 ; 面 写 操作 代表 于 务 所 有 的 修改 行为 。 

两 个 事务 TI 和 T, 执 行 的 交错 读 瑟 操作 可 能 如 下 所 未: 


[10.1.2] ... RolA} WatA) RI(A) RI1(B) R2(B) WlB} C1 C2 ,.. 


类 和 似 以 上 的 一 个 操作 序列 称 为 事务 经 历 ， 或 者 称 之 为 一 个 调度 。 在 经 历 [10.1.2] 中 ， 我 们 
可 以 看 到 事务 T, 先 对 A 执行 读 操 作 ， 然 后 T, 将 一 个 新 的 值 写 回 到 A 太 A 中。 随后 TT, 对 取 和 A 的 新 值 ， 
最 后 C, 和 CC, 分 别 代 表 事 务 T, 和 T, 的 提 区 操作 。 这 样 一 个 经 历 是 应 用 程序 级 别 上 同时 执行 的 两 个 
事务 所 发 出 的 调用 的 结果 (和 参见 图 10-1 )， 最 给 转 恋 为 数据 库 调 度 器 层次 上 春 到 和 的 如 [10.1.2] 的 
形式 。 

为 了 给 后 面 几 节 将 要 讲 到 的 内 容 做 一 些 铺垫 ,我们 将 向 你 展示 数据 库 调 度 器 (参见 图 10- 
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1) 是 如 何 姓 理 像 我 们 在 经 历 [10.1.2] 中 所 春 到 的 交错 操作 序列 的 ， 从 而 使 得 调度 器 产生 的 操 
作 序 列 在 执行 效果 上 等 价 于 一 个 上 串 行 调度 。 在 这 种 方式 下 ， 我 们 能 保证 每 个 事务 与 其 他 事务 
都 是 隔 访 的 ， 也 就 是 痪 我 们 提供 了 隔离 性 保证 - 当 调 度 器 发 现 某 些 操 作 在 当前 顺序 中 会 破坏 
而 凯 性 时 融会 延迟 孩 操 作 的 执行 ， 以 此 来 你 证 阴 离 性 ; 在 茶 些 特 珠 情 放 上 让， 调度 内 发 现 死 锁 
( 我们 已 经 在 第 5 重 介 绍 过 }， 这 时 需 通 过 将 茶 个 事务 强行 寞 常 中 止 来 解除 化 锁 。 事 实 上 ， 从 可 
申 行 化 的 角度 来 看 经 历 [10.1.2] 表 示 一 个 不 合法 的 操作 序列 ， 数 据 库 凋 度 占 是 不 允许 出 现 这 种 
形式 的 。 


代表 用 户 发 出 调用 : 
OPEN CURSOR, UPDATE. FETCH 
SELECT INSERT. DRLETE, COMMIT 


WORK, ROLLBACK 。 


点 用 程序 


在 适当 的 时 候 初 始 化 事务 和 解释 调用 ;为 事务 T 赋 
事 竺 管理 器 !TMD 以 事务 号 ， 决 定 死 饥 时 异 些 中 站 荆 事 务 : 将 
ROLLBACK 操作 转 搞 为 ABCOR 人 调用 。 


将 所 有 的 调用 解释 为 读 写 操作 ; 通过 使 用 该 锁 御 写 
镇 保 让 可 串 条 化 调度 ;检测 紫 错 并 将 结果 返回 给 
TM » 





图 10-! 事务 系统 的 层次 结构 图 


之 所 以 说 这 个 经 历 是 不 合法 的 是 因为 这 一 操作 序列 所 给 出 的 操作 顺序 在 某 些 情形 下 可 能 
导致 不 一 致 的 结果 。 我 们 称 之 为 该 经 历 的 一 个 解释 。 

例 10.1.1 ”我 们 将 给 出 经 历 [10.1.23] 的 一 个 解释 ， 可 以 看 到 如 何 导致 不 一 致 的 结果 。 为 达到 这 
一 日 的 ， 对 将 要 读 取 的 数据 项 我 们 给 以 特定 的 值 ， 并 假定 事务 对 该 数据 项 最 后 写 人 的 值 和 从 该 
数据 项 读 到 的 值 相关 ， 然 后 定义 一 个 一 致 性 规则 ， 我 们 可 以 看 到 该 规则 将 被 这 些 操作 破坏 . 假 
设 数据 项 A 和 B 是 某 个 银行 客户 所 拥有 的 两 个 账户 ， 它 们 的 初始 值 为 A=50 和 B=50。 类 似 例 于 5.4.1 
和 5.4.2 中 为 了 引出 事务 隔离 性 的 要 求 所 给 出 的 不 一 致 分 析 ， 事 务 T 只 是 简单 地 对 这 两 个 账户 的 余 
额 相 加 计算 该 客户 的 净 资 产 ， 从 而 对 该 客户 进行 信用 评测 。 和 事务 T, 执 行 从 一 个 账户 到 男 一 个 账户 
的 转账 操作 ， 将 数额 为 30 的 资金 从 账户 A 转 信 账户 B。 两 个 事务 都 必须 满足 这 样 的 一 致 性 要 求 ， 
也 就 是 两 个 账户 的 资金 总 额 既 不 能 多 也 不 能 少 。 然 而 ， 由 于 这 两 个 事务 的 操作 以 调度 器 所 不 允 
许 的 顺序 交错 执行 ， 不 一 致 的 情况 就 有 可 能 发 生 。 以 下 是 给 出 了 县 体 值 之 后 的 经 历 [10.1.3]: 


f10.1.31 . .. RlA, 50) Wa{A, 20) Ry{A, 20) Ri1(, 50) R2{B, 50} WafB, 80) C+ C2.. , 


我 们 可 以 看 到 ， 在 事务 T. 对 A 执 行 了 写 操作 之 后 { 这 时 A 的 值 变 为 20 )， 事 务 T 读 取 了 A 的 
值 ， 而 旦 在 事务 T, 对 B 的 值 进行 改变 之 前 T, 读 取 了 B 的 值 ( 这 时 读 到 的 是 50 )。 这 样 事务 T, 计 算 
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得 到 的 值 是 70， 这 个 值 无 论 是 在 T: 执 行 前 或 者 在 执行 后 计算 都 是 一 个 不 正确 的 值 。 这 样 的 不 
一 致 视图 当然 会 导致 错误 的 信用 评测 续 果 。 导致 不 一 致 的 原因 是 事务 T 使 用 了 事务 T; 的 部 分 绪 
当 。 这 两 个 事务 设 有 很 好 的 相互 并 高 。 国 

这 种 部 分 结果 的 视图 在 事务 的 操作 不 相互 交错 时 是 不 会 发 生 的 。 考 虑 以 下 两 个 串 行 经 历 ， 
在 一 个 事务 的 所 有 操作 完成 之 前 ， 不 执行 其 他 事务 的 任何 操作 ， 如 图 10-2 所 示 。 





图 10-2 [10.1.21 的 两 个 串 行 经 历 


可 以 看 到 这 两 个 经 历 都 能 得 到 数据 A 和 B 的 一 臻 视图。 在 第 一 种 情形 下 ，T, 计 算 50 和 50 的 
和 为 100， 在 第 二 种 情形 下 计算 80 和 20 的 和 和 为 100， 符 合 一 致 性 要 求 。 很 明显 ， 如 果 所 有 事务 
各 自 者 满足 该 一 致 性 规则 (资金 总 额 平衡 )， 则 这 些 事 务 的 任何 串 行 调度 也 是 满足 一 致 性 要 求 
的 : 系统 的 资金 总 额 平衡 。 然 而 ， 如 果 执 行 的 是 转账 操作 ， 邦 么 在 事务 操作 序列 的 某 些 中 间 
点 资金 总 额 是 不 守恒 的 ， 因 为 我 们 不 可 能 将 从 一 行 中 扣 钱 和 往 另 一 行 上 加 钱 在 一 个 写 操作 内 
完成 。 修 政事 务 的 部 分 结果 视图 问题 在 于 数据 的 不 一 人 歼 状 态 可 能 被 其 他 事务 所 看 到 。 但 是 如 
果 事 务 只 是 以 串 行 的 方式 执行 ， 则 不 会 出 瑰 这 些 问题 ， 因 为 在 一 个 事务 的 所 有 操作 结束 之 前 ， 
其 他 事务 的 操作 不 能 开始 ， 自 然 也 不 会 访问 到 数据 的 不 一 致 状态 ， 因 此 例 110.1.3] 中 的 不 一 致 
问题 就 不 会 发 生 了 。 

接 下 来 的 内 容 中 ， 我 们 使 用 串 行 执行 的 效果 作为 事务 调度 正确 性 的 标准 。 我 们 说 一 个 多 
个 事务 的 操作 相互 交错 的 经 功 是 可 串 行 化 的 ， 邵 果 该 经 历 的 执行 效果 与 这 些 事务 的 某 个 串 行 
经 历 的 执行 效果 相同 。 我 们 称 这 两 个 经 历 是 等 价 的 。 但 我 们 如 何 来 判断 - -个 未 被 解释 的 经 历 
其 执行 效果 等 价 于 一 个 品行 经历 呢 ? 我 们 再 来 回忆 一 下 例 10.1.1， 当 我 们 定义 了 一 个 一 致 性 规 
则 (资金 总 额 必 须 平衡 ) 并 假定 了 一 个 事务 的 已 标 ， 从 而 导致 经 历 H 中 一 系列 对 具体 值 的 读 写 
操作 时 〈 比如 [10.1.3] )， 我 们 说 我 们 创建 了 经 历 的 一 个 解释 H (比如 例子 [10.1.2] j 如 果 可 以 
证 明 经 历 的 一 个 解释 HH 违反 了 一 致 性 规划 { 比如 T, 看 到 了 一 个 不 可 能 存在 的 总 余额 )， 那 么 这 
个 经 历 就 不 可 能 和 任何 一 个 串 行经 历 等 价 。 接 下 来 我 们 将 看 到 许多 这 样 的 例子 。 

现在 我 们 可 以 来 回顾 一 下 在 本 章 开 始 时 向 大 家 介绍 的 事务 的 四 个 性 质 ， 即 ACID 性 质 。 我 
们 说 事务 具有 以 下 性 质 ; 

原子 性 事务 的 更 新 操作 必须 作为 一 个 整体 ， 要 人 么 全 部 成 功 宪 成， 要么 全 部 失败 。 

一 至 性 ”事务 的 成 功 完成 将 数据 库 从 一 个 一 致 状态 转变 到 另 一 个 一 致 状态 。 比 如 ， 如 果 一 
致 性 要 求 资 金 总 额 既 不 能 凭空 多 出 来 ， 也 不 能 无 端 地 消失 ， 那 么 成 功 执行 的 前 后 状态 必须 具 
有 相同 的 总 余额 。 

隔离 性 ”即使 多 个 事务 并 发 执行 ， 着 上 去 要 像 每 个 成 功 事务 按 串 行 调度 执行 一 样 。( 某 些 
事务 必须 强行 异常 中 止 以 保证 申 离 性 ， 比 如 在 死 锁 情 况 下 ， 这 些 异 常 中 止 的 事务 可 以 在 稍 后 
重新 执行 。 就 像 例 子 5.4.4 向 我 们 演示 的 那样 )。 

持久 性 ”一旦 事务 提交 ， 那 么 它 对 数据 所 作 的 修改 将 是 持久 的 ， 无 论 发 生 何 种 机 器 和 系 
统 故障 。 

事务 的 原子 性 、 罩 离 性 、 持 久 性 由 数据 库 系 统 加 以 保证 ， 从 而 使 得 编程 人 人员 不 必 人 关心 这 
些 问 题 。 一 致 性 是 事务 的 一 个 讽 辑 属性 ， 一 般 要 求 程 序 员 在 编写 程序 中 予以 保证 ， 即 在 电离 
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环境 下 安排 合理 的 远 辑 。 通 过 保证 事务 的 隔离 性 ， 系 统 同样 也 保证 本 程序 中 定义 的 一 狂 性 ， 
即使 在 人 交错 操作 存 系 统 裔 注 的 情况 下 。 


10.2 交 第 的 读 写 操作 


我 们 已 经 知道 对 于 -一 个 串 行经 历 而 言 ， 不 会 产生 由 于 不 同事 务 的 读 写 操作 交错 执行 而 导 
化 的 不 一 致 的 问题 ， 因 为 在 品行 经 历 中 在 一 -个 事务 的 所 右 操作 完成 之 前 ， 其 他 任何 事务 的 操 
作 都 不 能 执行 。 那 么 为 什么 我 们 要 交错 执行 来 自 不 同事 务 的 读 写 操作 呢 ? 为 什么 不 将 所 有 的 
毛 务 都 按 闫 格 地 串 行 执行 呢 ” 下 面 这 个 方法 可 以 作为 湖 度 器 用 在 操作 上 实现 事务 的 喉 行 执行 
的 规则 : 一 旦 事务 T 执行 了 一 个 数据 访问 操作 〔R. 或 w,) 开始 该 事务 ， 我 们 说 该 事务 T, 是 活动 
的 ， 或 者 说 在 执行 中 ,此 时 如 末代 表 另 外 一 个 用 户 的 事务 T, 向 调度 器 发 出 了 一 个 初始 化 该 事 
务 的 把 作 (R 或 W, )， 调 度 上 蟹 将 使 事务 工 处 于 等 待 状 态 直到 了 完成 -一 一 也 号 是 直到 T 异常 中 止 
(A 或 提交 (C,)， 如 果 有 多 个 种 务 被 焊 制 等 待 ， 那么 当 毛 务 调度 器 发 现 果 个 事务 结束 时 ， 将 使 
用 先 来 先 服务 的 策略 启动 下 一 个 事务 的 执行 ( 执行 该 事务 的 第 一 个 操作 )。 

大 钉 数据 库 系统 不 强制 事务 严格 串 行 执行 的 原因 很 简单 不同 事务 的 操作 的 交错 执行 大 
大 地 提高 了 系统 的 性 能 。 在 处 埋 过 程 中 允许 多 个 事务 并 发 执行 意味 着 当 一 个 事务 进行 IO 操作 
时 ， 男 外 一 个 事务 可 以 使 用 CPU， 这 样 就 提高 了 整个 系统 的 吞吐 阐 ， 香 叶 率 以 给 定时 间 内 完 
成 的 事务 数量 来 衡量 。 因 为 HO 操作 较 费 时 间 ， 因 此 当 有 和 凶 个 磁盘 并 允许 问 时 有 多 个 酒 动 事 务 
时 ， 将 大 大 提高 系统 的 吞吐 率 。 

例 10.2.1 假定 用 大量 用 户 在 等 待 事务 型 应 用 的 服务 ， 每 个 事务 按照 以 下 的 顺序 使 用 CPU 
和 LO 资源 : (使 用 CPU ) Rs 【使 用 CPU ) 殉 (IC，RC 和 WwW) 代表 LO 操作 。 我 们 假设 系统 
只 有 一 个 CPU， 提 将 操作 不 使 用 任何 资源 ，CPU 使 用 的 时 间 片 为 Sms (0.005s )， 每 个 IO 操作 
(无论 是 RA(*) 还 是 W(*) ) 党 要 等 待 50ms。( 我 们 可 以 看 到 ,一 个 VO 操作 立即 得 到 服务 时 只 需 
要 12.5ms ， 然 而 等 待 队 列 使 得 平均 服务 时 间 变 慢 : 在 下 面 的 讨论 中 我 们 以 单个 事务 的 线程 作 
为 开始 ， 这 是 讨论 多 个 用 户 并 发 情 视 的 基础 ， 在 多 用 户 并 发 时 等 待 就 是 经 常 的 事 了 。} 我 们 可 
以 合用 图 10-3 所 示 的 调度 图 来 描述 一 组 严格 串 行 调度 的 事务 所 产生 的 操作 的 事件 序列 。 
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图 10-3 上 巾 行 事务 调度 中 的 事件 序列 


在 图 10-3 中 资源 使 用 情况 用 阶 和 兵 功能 图 来 表示 ， 以 一 定 的 间隔 来 表示 使 用 CPU 和 磁盘 VO 
所 用 的 时 间 。 每 个 磁盘 操作 以 将 要 执行 的 事务 的 存 取 操 作 作 为 标记 ， 比 如 Re 和 Wi*)。 我 们 
可 以 看 到 每 个 事务 开始 先 占 用 Sms 的 CPU ， 然 后 是 Re) 操作 占用 50ms 的 MO 时 间 ， 接 下 去 又 是 
占用 jms 的 CPU 时 间 ， 最 后 的 Ww,(“) 操 作 占 用 50ms 的 MO 时 间 。 提 交 操 作 C 不 占用 任何 赛 源 ， 因 
此 时 间 为 0， 于 是 下 一 个 事务 可 以 立即 开始 。 国 此 每 个 成 功 完成 的 事务 总 共 需 要 占用 110ms 的 
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时 间 ， 也 就 是 说 每 肾 110ms 完 成 一 个 事务 ， 所 以 在 吐 率 为 每 秒 9.09 个 事务 〔【9.09TPS )。 在 这 种 
情 部 下 ，CPU 未 被 充分 使 用 ， 因 为 在 ]10ms 的 时 间 中 只 有 10ms 在 使 用 CPU ， 也 就 是 说 使 用 率 
只 有 9.09%， 但 是 磁盘 却 得 到 了 很 好 的 使 用 率 ，110ms 中 有 100ms 在 使 用 磁盘 ， 如 有 果 有 其 他 进 
程 在 使 用 位 稚 这 一 -比例 其 全 会 更 高 。 

图 10-4 显 示 了 两 个 事务 的 操作 交错 执行 的 情况 ,但 系统 仍然 内 有 一 个 磁盘 。 为 了 能 够 描 
给 出 两 个 并 发 事务 进程 (或 者 事务 线程 ) 的 资源 使 用 情况 ， 我 们 在 图 的 左边 对 CPU 和 届 盘 分 
别 使 用 了 两 个 标记 ， 尽 管 如 此 陌 个 标记 表示 的 是 同一 个 CPU 和 伐 盘 。 
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图 10-4 一 个 磁盘 上 两 个 交错 事务 的 事件 序列 


在 图 10-4 中 我 们 可 以 看 到 两 个 事务 线程 大 部 分 时 间 在 等 待 对 方 完成 70 操作， 以 便 进行 
自身 的 IO 操作 。 然 而 我 们 可 以 看 到 这 种 调度 成 功 地 将 CPU 使 用 时 间 和 磁盘 IO 操作 重合 让 来 。 
每 个 事务 要 求 100ms 的 磁盘 访问 ， 这 样 磁 盘 被 充分 地 利用 起 来 ， 而 没有 像 以 前 那样 每 110ms 
中 有 10ms 的 空闲 时 间 。 从 长 远 米 看 ， 因 为 1fO 操 作 花 的 时 间 是 关键 因素 ， 因 此 在 这 种 调度 方 
式 下 我 们 得 到 的 吞吐 率 是 每 100ms 完 成 一 个 事务 ， 也 就 是 10TPS, 一 个 其 体 的 调度 用 图 来 表 
示 世 许 不 是 很 清楚 ， 因 此 我 们 在 下 面 详细 锅 述 。 在 例子 开始 时 ， 我 们 看 到 事务 T, 占 用 5ms 
的 CPU， 然 后 是 R,Cs) 操 作 占 用 5S0ms 的 MO 时 间 ， 接 下 去 又 是 占用 ms 的 CPU 时 间 ， 接 者 是 花 
费 45ms 等 待 RA*) 完 成 IO 操作 ， 最 后 的 W.(*) 操 作 占 用 50ms 的 LO 时 间 ， 整 个 事务 完成 。 上 总 共 
花 的 时 间 是 :5+50+54+45+50=155ms。 这 个 时 间 遂 常 是 比较 快 的 ， 因 为 T, 是 最 先 使 用 资源 的 。 
然而 ， 其 他 的 后 继 事 务 T 花 费 Sms 使 用 CPU， 花 费 4Sms 等 待 磁盘 ， 兹 费 30ms 进行 R(*) 操 作 ， 
接着 又 是 花费 5ms 使 用 CPU，45ms 等 待 位 盘 ，50ms 进 行 W,(*) 操 作 ; 因此 总 共 花 的 时 间 古 : 
5+45+50+5+45450=200ms。 因 此 总 地 来 看 ， 每 个 线程 运行 一 个 事务 需要 200ms 时 间 ， 两 个 事 
务 一 起 执行 时 每 个 是 事务 占 100ms， 即 10TPS。 

在 图 10-5 中 我 们 可 以 看 到 两 个 事务 线程 交错 操作 ， 奇 数 号 的 线程 在 伐 盘 1 上 进行 MO 拘 作 ， 
而 偶数 号 的 线程 在 磁盘 2 上 进行 LO 操作 ( 当然 在 现实 的 系统 中 没有 这 么 理想 ， 这 一 点 我 们 将 在 
稍 后 讨论 }。 我 们 可 以 看 到 两 个 线程 执行 过 程 中 没有 任何 等 待 ( 除了 最 初 的 ms 等 待 ， 当 时 人 T 正 
在 使 用 CPU， 因 此 T 必 须 等 待 ) 在 后 而 的 CPU 使 用 中 ， 最 初 的 等 待产 生 的 时 间 偏 移 使 得 奇数 号 
的 线程 和 偶数 号 的 线程 的 不 会 重 晋 〈 这 对 一 个 实际 系统 而 言 是 完全 不 现实 的 )。 就 像 在 图 10-3 
中 看 到 的 ， 每 个 事务 线程 每 110ms 执 行 -个 事务 ， 即 9.09TPS ， 当 两 个 事务 线程 同时 执行 时 将 得 
到 两 倍 的 吞吐 率 ， 即 18.18TPS。 在 这 种 情形 下 ， 每 5$sms 中 CPU 使 用 10ms， 利 用 率 为 18.18 匈 。 
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图 10-5 两 个 爸 盘 上 两 个 交错 事务 的 事件 序列 


为 了 进一步 提高 CPU 的 利用 率 ， 我 们 可 以 增加 更 黎 的 磁盘 、 运 行 更 多 的 事务 线程 ， 从 而 
获得 更 太 的 操作 重 又 。 图 10-6 给 出 了 具有 1i 个 磁盘 和 11 个 事务 线程 情况 下 的 示意 图 ， 我 们 假 
定 资源 重生 使 用 情况 是 理想 的 。 在 这 种 情况 下 所 有 11 个 事务 线程 部 是 全 器 运行 的 . 每 个 事务 
仍然 是 花 110ms 时 间 ， 但 是 11 个 事务 线程 是 同时 运行 的 ， 因 此 在 110ms 中 我 们 可 以 完成 11 个 事 
务 ， 邑 100TPS。 由 二 假定 资源 使 用 具有 非常 好 的 重生 性 ，CPU 的 使 用 率 为 100%。 二 
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图 10-6 11 个 配 和 碍 上 11 个 交错 事务 的 事件 序列 


对 于 一 个 事务 系统 而 言 ，$ms 的 CPU 时 间 与 S0ms 的 IO 操作 时 间 之 比 是 很 正常 的 。 由 于 
计算 机 的 速度 变 得 越 来 武 快 ， 这 一 比例 会 变 得 越 来 越 大 ， 因 为 CPU 速度 的 提高 要 比 磁盘 IO 
操作 的 速度 提高 要 快 得 多 。 由 于 这 个 原因 许多 事务 型 系统 往往 配置 了 大 量 的 磁盘 来 缓解 两 者 


的 差异 。 
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当然 对 于 并 发 执行 的 事务 ， 并 不 能 保证 它们 像 图 10-6 所 描述 的 那样 ， 能 够 访问 不 同 的 磁 
盘 从 而 很 理想 地 将 CPU 时 间 和 JMD 时 间 重 亚 。 对 于 例 10.2.1 中 的 工作 ( 10ms 的 CPU 时 间 和 5S0ms 
的 IO 时 间 )， 让 我 们 看 一 下 DBA 通 带 采 取 的 配置 方法 。!( 在 下 面 的 分 析 中 我 们 将 考虑 用 实际 移 
动 磁盘 臂 过 程 中 占用 的 时 间 2sms 代 替 原 来 笼统 的 50ms 的 IO 时 间 ， 外 为 这 一 决定 会 影响 实际 
的 磁盘 等 待 时 间 )。 如 果 我 们 很 好 邮 表 达 这 一 问题 ， 它 实际 上 是 数学 中 的 排队 理论 。 遗 憾 的 是 ， 
如 果 设 有 一 定 的 数学 背景 ， 很 难 将 这 个 原理 讲 清楚。 但 我 们 可 以 试 善 使 你 有 一 些 某 本 的 了 解 。 
对 于 LO 与 CPU 时 间 $ 比 1 这 样 一 个 比例 比较 明智 的 配置 是 : 磁盘 数 要 大 大 超过 5 个 ， 比 如 10 个 
磁盘 ; 然后 同时 运行 10 个 以 上 的 事务 线程 ， 比 如 20 个 。 这些 事 务 要 恋 写 的 数据 应 该 均匀 地 分 
布 在 这 些 磁 盘 上 ， 这 样 任 意 一 个 事务 线程 的 任意 -个 R(9 或 Wo 操作 都 有 了 可 能 访问 这 些 磁 夫 
中 的 任何 一 个 。 很 明显 随 着 我 们 增加 磁盘 的 个 数 ， 对 于 任何 一 个 事务 线程 ， 当 它 完 成 CPU 使 
用 而 要 到 磁盘 上 进行 数据 存 取 时 ， 它 会 发 现 数据 所 在 磁 堆 往往 是 可 用 的 ， 并 没有 被 其 他 事务 
线程 所 占据 。 因 此 不 会 产生 多 个 事务 在 队列 中 等 待 的 现象 。 在 此 外 我们 所 做 的 只 是 通过 增加 
磁盘 个 数 来 丹 短 平 均 磁盘 沪 问 时 间 和 和 CPU 使 用 时 间 的 比例 。 尽 管 在 坟 上 讨论 的 例子 中 我 们 指 
证 磁盘 访问 时 间 为 30ms， 伍 对于 给 定 的 随机 磁盘 访问 速度 ， 实 际 的 磁盘 访问 时 间 俯 赖 于 可 用 
的 磁 扒 数 ， 后 者 可 以 减 小 等 待 队 列 的 长 度 。 在 下 面 的 讨论 中 我 们 假定 一 个 更 低 的 限制 为 25ms。 

现在 DBA 同 样 需要 降低 购买 硬件 的 费用 ， 这 就 要 求购 买 的 伐 盘 个 数 不 能 超过 实际 充分 使 
用 CPU 所 必 活 的 磁 和 荔 个 数 。 这 意味 着 仍然 可 能 存在 大 看 的 磁盘 访问 冲突 ， 即 在 相近 的 时 间 不 
同 的 事务 线程 向 同一 个 目的 磁盘 提出 了 IO 操作 请 求 ， 这 样 我 们 肯定 不 可 能 获得 像 图 10-6 那 样 
的 完美 的 重合 执行 。 如 果 我 们 只 是 运行 11 个 事务 线程 ， 而 平均 的 IO 访问 时 间 为 Soms， 这 样 就 
会 产生 非常 严重 的 问题 ， 纹 为 在 这 种 情形 下 只 有 当 这 些 TQ 请 求 能 很 好 地 交错 时 才能 保证 CPU 
被 充分 的 利用 。 但 是 如 果 我 们 有 2%0 个 并 发 的 线程 ， 那 么 就 可 以 有 令 人 信服 的 同样 多 的 20 个 并 
行 运 行事 务 。 任 何 一 个 时 刻 ， 任 何 一 个 事务 必定 姓 于 以 下 几 种 情况 之 --: 一 些 事务 正在 等 待 
CPU 变 得 可 用 或 者 正在 使 用 CPU ( 我 们 黎 这 些 事务 处 在 CPU 队列 中 )，- 一 些 种 务 正在 等 待 某 个 
磁盘 变 得 可 用 或 者 正在 使 用 某 个 磁盘 【我 们 称 这些 事 务 处 在 其 个 磁盘 的 队列 中 )。 为 了 获得 较 
商 的 CPU 利用 率 ， 我 们 只 需要 保证 CPU 队列 几 平 不 为 空 就 行 了 ( 如果 是 空 的 ，CPU 就 没有 事 
务 可 执行 )， 因 此 如 果 我 们 能 够 保证 一 个 平均 较 长 的 CPU 队列 ， 就 能 达到 目标 。 很 清楚 ， 如 果 
我 们 能 够 保证 在 任何 时 刻 10 个 磁盘 中 有 大 约 5 个 磁盘 在 被 使 用 ， 那 样 我 们 就 达到 上 月 标 了 。 根 据 
排队 理论 的 一 个 基本 原理 ， 如 果 一 个 请 求 者 《 某 个 事务 ) 释放 某 个 系统 资源 ( 比如 伐 盘 ) 到 
做 出 另外 一 个 资源 请 求 { 比如 CPU ) 可 快 于 该 请 求 者 获得 服务 的 时 间 ， 那 么 超 负 奏 的 资源 提 
供 者 的 队列 将 无 限制 加 长 。( 对 于 单个 CPU 而 言 ， 由 于 磁 稚 对 CPU 的 服务 时 间 比 是 25ms 比 Sms， 
因此 当 我 们 平均 有 超过 5 个 磁盘 在 同时 提供 服务 时 ，CPU 就 能 够 汶 负 荷 运 行 。) 

通过 允许 大 量 的 线程 同时 运行 (即使 在 某 些 磁盘 上 发 生 ID 请 求 冲突 时 我们 为 系统 提供 更 
多 要 做 的 事情 。 尽 管 一 些 线 程 处 于 等 待 YO 服 务 的 状态 ，CPU 可 以 运行 其 他 的 事务 线程 从 而 产 
生 更 包 的 LO 请 求 。 有 了 足够 的 WO 请 求 之 后 ， 这 些 请 求 肯 定 会 分 布 到 不 仅仅 是 10 个 磁盘 中 的 5 
个 磁盘 ， 这 样 就 能 保证 CPU 被 高 效 地 使 用 。 应 该 广 意 的 是 我 们 不 需要 仅 仪 因为 我 们 可 以 同时 
运行 20 个 线程 而 去 并 发 执行 20 个 事务 ， 事 实 上 到 目前 为 止 我 们 所 解释 的 每 一 件 事 都 是 一 个 反 
恋 这 程 的 一 部 分 。 当 一 个 新 的 事务 进 人 系统 时 ， 系 统 将 其 分 配 魏 一 个 单独 的 线程 ， 以 便 20 个 
事务 能 够 并 发 地 执行 。 然 而 ， 对 于 仅仅 有 20 个 并 发 事务 而 言 ， 事 务 的 完成 速度 可 能 非常 快 
一 一 更 大 的 并 发 事务 数 则 意味 着 更 高 的 吞吐 率 ， 通 常 我们 不 需要 最 大 的 并 发 线程 数目 。 同 样 
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我 们 也 不 需要 100 久 的 CPU 利用 率 ， 也 许 90 允 或 者 95 允 就 差 木 儿 了 ， 另 一 方面 ， 如 果 CPU 利 用 
率 太 低 ， 这 样 处 理工 作 负 载 的 存 上 时 率 就 过 不 到 要 求 。 这 时 更 多 的 事务 会 进 人 系统 并 发 执行 ， 
直到 达到 最 大 数 20， 于 是 磁盘 和 CPU 又 被 充分 利用 起 来 。( 在 所 有 20 个 线程 都 被 占用 以 后 ， 其 
他 事务 就 必须 在 另 一 个 队列 中 等 待 ， 直 到 分 配 到 线程 。) 

因此 当 有 更 多 的 磁盘 和 线程 如 人 到 系统 中 时 ， 我 们 就 必须 依赖 统计 手段 来 提高 CPU 的 使 
用 率 了 -. 对 这 -- 太 法 的 具体 实现 有 兴趣 的 法 者 可 以 去 阅读 一 篇 关于 排队 理 沦 标准 的 介绍 性 读 
物 。 建 议 读者 参考 本 章 后 面 的 “推荐 读物 ”。 


10.3 可 串 行 化 和 前 趋 图 


在 本 节 中 我 们 将 推导 出 一 个 识别 给 定 的 经 历 ( 比如 [10.1.2] ) 是 否 可 囊 行 化 的 标准 。 这 意 
昧 着 一 个 经 历 等 价 于 (等 价 的 定义 将 在 下 面 的 内 容 中 给 出 ) 某 个 囊 行经 历 (在 一 个 经 历 的 所 
有 操作 完成 之 前 其 他 经 历 的 操作 水 能 执行 )。 一 个 可 串 行 化 的 经 历 能 够 被 一 个 支持 事务 隔离 性 
的 系统 调度 器 所 接受 。 在 定义 事务 的 等 价 之 前 我 们 先 来 讨论 一 下 什么 时 候 - :个 串 行 经 历 中 两 
个 事务 的 交错 操作 是 冲突 操作 。 如 果 两 个 不 同事 务 发 出 的 读 写 操作 访问 的 是 同一 个 数据 对 象 ， 
并 且 其 中 至 少 有 一 个 是 写 操作 另外 一 个 可 以 是 写 也 可 以 是 读 )， 我 们 说 这 两 个 操作 是 冲突 的 。 
这 个 概念 在 定义 10.3.1 中 会 有 更 准确 地 表述 。 大 家 将 看 到 经 历 中 不 同事 务 的 两 个 冲突 操作 在 经 
历 中 出 现 的 顺序 将 是 很 重要 的 一 个 因素 。 对 于 两 个 包含 相同 事务 性 操作 的 经 历 ， 如 果 所 有 的 
冲 罕 操作 对 在 两 个 经 历 中 具有 相同 的 次 序 ， 即 使 其 他 一 些 操作 在 次 序 上 可 能 有 些 差 异 ， 这 两 
个 经 历 仍然 可 以 说 是 等 价 的 。 有 了 这 样 的 背景 ， 既 历 的 可 串 行 化 就 可 以 定 交 为 : 如 来 一 个 经 
历 等 价 于 一 个 趾 行 经 历 ， 这 个 经 历 就 是 可 品行 化 的 。 在 定理 10.3.4 中 我 们 给 出 了 一 个 确定 什么 
情况 下 一 个 经 历 是 可 串 行 化 的 标准 。 

为 了 更 好 地 了 解 一 些 概 念 ， 假定 我 们 有 一 个 类 和 杞 [10.1.2] 中 的 事务 性 操作 经 历 H。 假定 在 
经 历 H 中 ,一 个 事务 读 取 了 数据 项 A 的 值 ， 稍 候 男 一 个 事务 对 A 进行 了 更 新 ( 写 ) 操作 。 因此 
如 [10.3.1] 所 示 的 这 两 个 操作 出 现在 经 历 H 中 ， 其 中 它们 之 间 的 省 略 号 (…) 表 示 经 历 中 在 这 两 个 
操作 之 间 的 任何 操作 。 

[10.3.47 .. .RitA)... WalA)... 

当 我 们 说 经 历 中 执行 了 更 新 操作 W,( AJ 时 ， 意 味 着 一 个 新 值 已 经 覆盖 了 数据 项 A 中 原来 的 
值 。 我 们 没 必 要 认为 该 更 新 操作 有 隐 含 的 是 由 SQL 中 的 Update 语 句 完成 的 ， 因 为 此 处 我 们 并 没有 
指出 这 个 写 人 的 新 值 和 数据 项 A 原 来 的 值 有 和 什么 必然 的 联系 。( 当然 我 们 也 没有 否定 可 能 会 先 
读 A 原 来 的 值 。) 如 果 该 操作 风 含 着 先 要 进行 一 以 读 操作 ， 我 们 可 以 用 … 民 AA)…WWA(A)… 来 代 
蔡 …WtA}……。 

现在 我 们 要 尽力 提出 一 个 和 经 历 H 等 价 的 串 行 经 历 ，H 中 包括 了 110.3.1] 中 的 两 个 操作 并 有 具 
有 相同 的 次 序 。 与 之 等 价 的 串 行 经 历 可 能 存在 多 个 ,但 是 我 们 不 妨 用 SH) 来 代表 它们 中 的 任 
何 一 个 。 对 于 任何 一 个 等 价 的 串 行 经 历 ， 我 们 可 以 肯定 事务 T: 的 任何 操作 都 在 事务 Ti 之 后 。 这 
是 因为 Tl 在 经 历 H 中 对 入 的 读 哥 作假 定 为 50 ) 在 事务 T, 对 A 的 写 操作 之 前 ; 这 一 写 操 作 有 可 
能 改变 A 的 值 《 假定 为 20 )。 我 们 可 以 构建 这 个 经 历 的 一 个 解释 。 央 为 在 所 有 的 等 价 串 行经 历 
中 ， 所 有 的 事务 和 经 历 H 中 一 样 该 取 的 是 祖 同 的 数据 项 ， 这 是 毫 无 疑问 的 ， 因 此 很 明显 在 两 种 
情形 下 事务 T, 都 必须 在 事务 T, 之 后 。 我 们 使 用 如 下 的 标记 : 


RitA} <<H W2lA) 
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表示 在 经 历 H 中 Ri(A) 在 WW,(A) 之 前 ， 而且 在 等 价 经 历 S(CH) ( 也 许 不 只 这 两 个 操作 ) 中 这 两 
个 操作 也 必须 保证 同样 的 先后 顺序 。 我 们 可 以 如 下 表示 : 

R1(A) <<SIH) WalAl) 

更 一 般 的， 由 于 在 串 行经 历 中 事务 T, 的 所 有 操作 都 是 在 一 起 执行 的 ， 因 此 我 们 可 以 用 事务 
T 本 身 来 表示 该 事务 所 有 的 操作 ， 所 以 可 以 表示 成 如 下 的 形式 ，; 


Ty <<8 人 和 工 > 


现在 我 们 需要 讨论 的 是 如 果 事 务 T, 在 事务 T, 对 某 个 数据 项 进行 写 操作 之 前 读 了 该 数据 项 的 
值 。 那 么 在 任何 一 个 等 价 的 串 行 经 历 中 这 两 个 操作 的 先后 顺序 不 能 其 倒 。 反 之 也 同样 成 立 ， 
即 如 果 经 历 H 中 事务 T, 在 事务 T, 对 某 个 数据 项 B 进 行 读 操作 之 前 修改 了 该 数据 项 的 值 。 在 等 价 
串 行经 历 中 两 者 先后 顺序 也 不 能 倒 过 来 。 

WatB} «<<H R1(B) 

由 此 我 们 可 雇 断 言 在 任何 串 行 经 历 S( 本 中 事务 T, 都 必须 在 事务 T, 之 脑 ， 即 : 

Ti<<sn 工 

到 目前 为 止 我 们 可 以 确定 的 东西 可 以 表述 如 下 : 如 果 经 历 H 中 分 韶 属 十 两 个 事务 T, 和 TT 的 
两 个 操作 X(A) 和 YY,(A} 是 冲突 操作 ， 当 其 中 -个 操作 在 另 一 个 操作 之 前 执行 时 ， 那 么 在 等 价 的 
串 行 经 历 中 相应 的 事务 也 应 该 保持 同样 的 先后 顺序 。 无 论 R(A) 和 WAI) 在 经 历 中 的 先后 顺序 
如 何 ， 它 们 都 是 冲突 操作 。 

为 了 放宽 条 人 忻 ， 我 们 已 经 确定 对 同一 个 数据 的 读 操 作 和 写 操作 是 冲突 的 。 在 只 有 两 种 操 
作 类 型 的 情况 下 只 可 能 有 四 种 组 合 类 型 我们 现在 需要 确定 的 是 读 操 作 和 读 操 作 之 间 是 否 可 
能 冲突 ， 即 有 (A} 和 RAA) 冲 突 吗 ?我 们 认为 它们 是 不 冲突 的 。 如 果 在 经 历 中 我 们 有 如 下 的 操作 
序列 : …RAA) Wi(A)…R(A)…， 那 么 由 于 两 对 读 写 冲 突 操 作 我 们 可 以 获得 以 下 结论 : 
T<<saT 且 T,<<swwT,， 因 此 由 传递 性 我 们 可 以 进一步 的 到 T,<<wwT,。 然 而 我 们 应 该 注 意 到 的 是 ， 
这 - :结果 并 不 是 由 于 分 别 属于 事务 T 和 T, 的 两 个 读 操 作 的 缘故 。 经历 H 有 操作 R(A)R(A)， 经 
历 H' 中 有 操作 RKAJ)R(A) 可 以 产生 同样 的 结果 ， 只 要 这 两 个 操作 之 间 没 有 任何 其 他 操作 介 人 。 

另 一 方面 ， 由 WA} 和 W(A) 构 成 的 操作 对 是 冲突 的 。 我 们 应 该 意识 到 这 鲍 个 操作 之 间 的 
前 后 顺序 是 关键 ， 因 为 由 于 两 个 操作 对 数据 对 象 A 写 人 的 值 不 一 样 ， 因 此 数据 对 象 A 的 值 将 由 
最 后 的 写 操 作 决 定 。 显 然 最 后 给 出 的 结果 不 一 样 的 两 个 经 历 肯定 是 不 会 等 价 的 。 图 10-7 给 出 
了 我 们 已 经 发 现 的 三 对 冲突 操作 。 





图 10-7 溃 突 操 作 的 三 种 类 型 


图 19-7 所 示 的 这 三 对 操作 和 我 们 已 经 得 出 结论 不 是 冲突 操作 的 操作 对 R,(A) 和 R(A) 一 起 ， 
构成 了 两 个 事务 T 和 T 对 同一 个 数据 对 象 的 所 有 可 能 的 操作 组 合 。 相 比 之 下 ， 在 不 同 数 据 对 象 
上 的 任何 操作 都 是 不 冲突 的 :比如 R.A) 和 WAB) 是 不 会 产生 溃 突 的 ， 因 为 这 两 个 操作 的 先后 吓 
序 根本 无 关 紧 要 。 如 果 两 个 不 同 的 事务 对 不 向 的 数据 对 和 象 进行 操作 ， 那 么 这 两 个 事务 执行 的 
先后 顺序 是 完全 不 相关 的 。 让 我 们 再 次 回 到 R,(A) 和 R(A) 的 例子 ， 我 们 可 以 想像 一 个 事务 T.， 
该 事务 的 操作 和 T, 的 RAA) 以 及 T 的 W(B) 相 冲突 ， 内 此 由 于 传递 性 导致 事务 T, 和 TT 必须 保持 茶 


ep ; 。 1 


事 10 美 间断 事 卷 469 


种 前 后 怖 序 ; 但 是 我 们 必须 申明 的 是 操作 R,(A) 和 WA(B) 本 身 并 不 是 冲突 的 。 作 为 对 前 面 讨论 内 
容 的 总 结 ， 我 们 给 出 下 面 的 定 文 。 

定义 10.3.1 我 们 说 经 历 H 中 两 个 操作 X(A) 和 YB) 是 冲突 的 当 且 仅 当 以 下 三 个 条 件 成 立 : 
(1) A=B。 不 同 数据 对 象 上 的 操作 是 不 会 冲突 的 。(2) izj。 不 同事 务 发 出 的 两 个 操作 才 可 能 
冲突 。( 3 ) 两 个 操作 XX 和 Y 中 有 一 个 是 写 操作 W。 田 一 个 操作 可 以 使 读 操 作 也 可 以 是 写 操 作 ， 量 


关于 经 历 中 冲突 操作 的 定义 看 起 来 像 是 数学 上 的 定 半 : 我 们 想 知道 它 可 以 有 哪些 应 用 。 
为 了 看 如 何 来 处 理 这 个 概念 ， 我 们 需要 使 用 以 下 一 些 例 子 。 让 我 们 回忆 一 下 在 [10.1.2] 中 给 出 
的 经 历 ， 我 们 和 不妨 把 它 记 为 经 历 Hl。 

H1 = Ry{tA} WolA) RI(A) RI1B} RytB} WalB) C1 C2 

我 们 应 该 仍然 记得 在 例 10.1.1 中 我 们 曾经 给 出 了 这 个 经 历 的 一 个 解释 ， 我 们 已 证 明 这 个 经 
历 是 不 可 申 行 化 的 。 

定义 10.3.2 ”经 历 H 的 任何 一 个 解释 有 以 下 三 个 部 分 组 成 (1) 经 历 中 关于 事务 的 逻辑 
昌 的 的 描述 ， 应 该 足以 证 明 事务 对 数据 写 人 的 值 和 事务 对 同一 数据 对 和 象 读 取 的 值 有 关系 。( 2 ) 
经 历 中 读 写 操作 的 值 要 给 出 具体 的 说 明 。(3) 一 致 性 规则 。 具 有 隔离 性 的 事务 执行 过 程 中 必 
须 保 持 的 某 种 逻辑 属 人 性， 这 些 事务 具 有 第 1 点 中 所 陈述 的 逻辑 属性 。 在 具有 交错 存 取 操作 的 
不 可 冲 行 化 的 经 历 中 ， 我 们 向 大 家 指出 经 历 中 的 某 些 事务 违反 了 一 致 性 规则 ， 面 这 在 任何 审 
行 执行 中 基 显然 不 可 能 发 生 的 。 图 

例 10.3.1 重新 考察 例 10.1.1， 由 下 面 给 出 的 经 历 H1 的 一 个 解释 可 得 出 的 结论 是 : 经 历 
H1 是 不 可 串 行 化 的 。 我 们 首先 来 考察 定 久 10.3.2 中 的 条 件 (2)， 即 读 写 操作 中 包含 的 具体 的 
数据 是 : 


H1 = RotA, 50) Wy{A, 20} Ri(A, 20} RJ{B, 50) R2{B, 50} WB, 80) C1 C2 


再 来 考察 定义 中 的 条 件 (1 )， 各 事务 的 逻辑 目的 是 : T, 做 的 是 客户 的 信用 检查 ， 即 对 可 
用 的 两 个 账户 A 和 3B 的 余额 进行 加 操作 。T: 做 的 是 从 账户 A 到 账户 也 的 转账 操作 (我 们 可 以 看 到 
要 转 的 这 笔 钱 是 30 )。 最 后 我 们 来 考察 定义 中 的 条 件 (3 )， 即 两 个 事务 都 没有 无 纤 无 战地 增加 
钱 的 数目 也 没有 毫 无 根据 地 减少 钱 的 数目 。 但 是 这 个 调度 是 不 可 串 行 化 的 ， 因 为 事务 T 看 到 
了 不 一 致 的 结果 ， 得 到 的 两 个 账户 A 和 B 的 余额 和 是 70， 而 不 是 我 们 在 串 行 经 历 中 可 以 看 到 的 
正确 值 100。 

冲突 操作 概念 的 引 人 可 以 使 我 们 用 更 直接 的 方法 来 检测 经 历 的 可 品行 性 。 可 以 注意 到 在 
经 历 H1 中 的 第 二 个 和 第 三 个 操作 是 一 对 冲突 操作 ，W; (A)<<n, RR, (A)。 根 据 我 们 关于 冲突 操 
作 的 讨论 ， 我 们 知道 任何 与 经 历 H1 等 价 的 串 行经 历 S(H1) 中 应 该 有 T,<<swwT,。 同 时 ,经 历 HI 
中 的 第 四 和 第 六 个 操作 也 是 冲突 操作 : R, (B)<<m W, (B)， 我 们 可 以 得 到 : Ti<<soT:。 很 明显 
我 们 得 到 的 两 个 结论 是 矛盾 的 ， 因 为 我 们 不 可 能 创建 同时 满足 T:<<snuT, 和 Ti<<sanT: 的 一 个 串 
行经 历 。 由 此 我 们 可 以 得 出 结论 : 经 历 H1 不 存在 等 价 的 串 行 经 历 。 本 


如 果 考 虑 导出 这 一 铺 论 的 两 个 事实 ， 则 会 看 到 例 10.3.1 恰 恰 为 我 们 前 面 的 说 法 提供 了 足够 
的 论据 ， 即 任意 一 个 经 历 中 冲突 操作 的 先后 顺序 在 该 经 历 的 等 价 串 行经 历 8(H) 中 必须 保持 。 
产生 不 一 致 的 原因 在 于 : (1) 于, 在 T, 对 A 进行 了 写 操作 之 后 对 A 进行 读 操 作 。( 2 ) T, 在 T: 对 B 进 
行 写 操作 之 前 对 8B 进 行 读 操作 ， 也 就 是 说 两 对 冲 罕 操 作 具 有 相反 的 方向 。 这 才 是 真正 的 原因 ， 
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即 为 秆 么 经 历 Hl 中 给 出 了 确切 的 值 之 后 ， 事 务 Tl 计 算出 了 一 个 任何 该 逻辑 的 串 行 执行 中 都 不 
可 能 计算 出 来 的 总 额 值 ， 在 任何 正确 的 等 价 串 行经 历 中 ， 其 中 一 个 冲突 操作 对 的 次 序 必须 倒 
过 来 。 

例 10.3.2 考虑 下 面 的 经 历 H2: 

H2 = Ri{A) RalAY WIIAT WalA) CIC3 

这 是 事务 不 一 致 问题 中 一 个 典型 的 丢失 更 新 间 题 , 有 时 候 也 称 之 为 “ 胜 ” 写 ( dirty write )。 
其 中 每 个 事务 都 是 先 读 某 个 数据 项 的 值 ， 然 后 再 向 这 个 数据 项 中 写 人 新 的 值 ， 却 没有 意识 到 
另外 一 个 事务 也 在 对 同一 个 数据 项 进行 同样 的 操作 。 就 像 前 商 的 给 出 的 经 历 的 解释 一 样 ， 假 
定 太 是 一 个 银行 账户 并 拥有 初始 的 余额 为 100， 事 务 T 试 图 向 该 账户 增加 40， 同 时 事务 T, 试 图 
二 该 账户 增加 50。 结 果 将 变 成 : 


Ri{A, 100) RotA, 100] WitA, 140) WalA, 150C1C; 


A 中 最 后 得 到 的 值 为 1530。 然 而 ， 按 照 这 两 个 事务 的 初始 意图 ， 在 任何 调度 之 后 得 到 的 结 
果 应 该 是 190。 因 此 这 个 润 度 是 不 可 串 行 化 的 。 事 实 上 ， 我 们 可 以 看 到 该 经 历 中 的 第 一 个 操作 
R.(A) 和 第 四 个 操作 W,(A) 是 一 对 冲突 操作 ， 纵 出 了 R,(A)<<n;W.(A)， 因 此 有 T,<<swasT,。 同 样 ， 
该 经 历 中 的 第 二 个 操作 R,(A}) 和 第 三 个 操作 W.(A) 是 一 对 冲突 操作 ， 给 击 了 R,(A)<<mW (A)}， 因 
此 有 T,<<snsT;。 于 是 类 似 例 10.3.1 ， 这 个 经 历 没有 等 价 的 串 行经 历 存 在 。 这 个 例子 展示 了 图 
10-7 中 类 型 {1) 的 两 对 冲突 操作 ， 即 RA)<<sW(A) 和 R(A)<<sW{A)， 从 而 如 解释 中 看 到 的 
那样 使 得 它们 所 在 的 经 历 变 得 不 可 串 行 化 。 是 


例 10.3.3 考虑 下 面 的 经 历 H3: 
H3 = WtAl WalA} WatB) Wi{B] Ci Ca 


这 个 经 历 向 我 们 展示 的 是 第 (3) 种 类 型 的 促 突 操 作 ，W-W 溃 突 对 。 这 同样 会 导致 经 历 变 
得 不 可 串 行 化 。 很 明显 ， 因 为 没有 读 操 作 ， 不 涉及 第 (1) 和 第 “2; 两 种 类 型 的 冲突 操作 。 
由 于 前 两 个 操作 给 出 了 Wi(A)<<mwwWxA)， 因 此 有 Ti<<snaT:。 同 样 ， 该 经 历 中 的 第 二 个 操作 
WB} 和 第 四 个 操作 W.(B) 是 一 对 剖 突 操作 ， 给 出 了 W(B8)<<sW(B)， 因 此 有 ,<<sT,。 因 此 
类 似 前 两 个 例子 ， 这 个 经 历 也 不 存在 等 价 扣 行经 历 。 那 么 我 们 如 何 来 构造 一 个 解释 来 说 明 这 
一 事实 呢 ? 假定 存在 两 个 账户 A 和 B， 初 始 这 两 个 账户 的 总 的 余额 是 90， 在 这 个 经 历 中 我 们 只 
处 理 一 种 类 型 的 事务 ， 即 向 这 两 个 账户 中 加 钱 ， 使 两 个 账户 的 余额 总 和 为 100。 我 们 给 出 的 一 
致 性 规则 是 两 个 账户 的 余额 总 和 不 得 超过 100。 需 要 注意 向 这 两 个 账户 中 加 钱 的 操作 基 不 需要 
读 取 账户 原来 的 余额 值 的 一 一 可 以 简单 地 向 账户 A 和 B 进 行 育 写 (不 需要 读 操 作 就 进行 写 ) 只 
要 两 个 账户 的 总 额 为 100 即 可 。 现 在 我 们 看 下 面 给 出 的 对 经 历 H3 的 一 个 同和 值 的 解释 : 

Wi (A, 50) WzlA, 80) WaztB, 20) Wi1IB, 50} C1Cy 


两 个 事务 均 违反 了 一 致 性 规则 (每 个 事务 在 单独 执行 时 都 将 使 两 个 账户 A 和 B 的 总 额 为 
100 )， 但 是 此 处 交错 调度 产生 的 最 终结 果 为 130， 直 反 了 一 致 性 规则 。 轿 

前 趋 图 

为 了 概括 我 们 在 以 上 三 个 鲍 子 中 看 到 的 关于 可 串 行 化 的 讨论 ， 某 些 冲 罕 换 作 的 构造 在 串 
行经 历 中 是 不 可 能 出 现 的 ， 为 此 我 们 定义 了 前 趋 图 。 前 趋 图 是 根据 经 历 II 构 造 的 一 种 结 攀 ， 它 
记录 了 隐 伟 在 经 历 的 冲突 操作 对 中 的 事务 之 间 的 先后 顺序 。 
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定义 10.3.3 “前 趋 图 ”经历 H 的 前 趋 图 是 一 个 记 为 PGGH) 的 有 向 图 。 前 趟 图 的 顶点 代表 经 
历 H 中 已 提交 的 事务 ， 也 就 是 说 那些 在 经 历 H 中 存在 忆 操 作 的 事务 T,。 图 中 任意 一 条 边 T 一 TT 代 
表 在 经 历 中 存在 -对 证 罕 操 作 筷 和 Y 也 保持 同样 的 先后 次 序 。 近 IT 一 工 应 该 理解 为 在 任何 等 价 
的 串 行经 历 S(H) 中 工 在 T 之 前 执行 ， 即 T<<、，T。 四 

经 历 H 中 的 任何 一 对 冲突 操作 都 对 应 着 前 趋 图 中 的 一 条 有 向 弦 ， 对 于 人 秽 10.3.1、 例 10.3.2，、 
例 10.3.3 中 的 经 历 对 应 的 前 赵 图 都 是 一 样 的 ， 如 下 所 示 。 


我 们 可 以 看 到 这 张 图 中 形成 一 个 环 ， 由 于 这 个 原 内 我 们 断定 该 经 历 没有 等 价 的 串 行 经 历 
存在 。 任 条 串 行经 历 都 必须 将 事务 T, 或 者 T, 放 在 另 一 个 事务 的 前 面 ， 不 站 假设 Ti<<saT:， 那 人 么 
根据 该 前 趋 网 至 少 有 一 条 返回 边 , 也 就 是 从 事务 工 指 向 Ti。 现 在 由 于 两 个 事务 中 存在 冲突 操作 ， 
因此 前 趟 图 PG(HJ 中 存在 一 条 边 ， 这 条 按 的 指向 就 是 冲突 操作 在 又 历 中 的 先后 次 序 。 串 行经 历 
对 应 的 PG(H 有 一 条 返回 边 意味 着 我 们 将 原来 经 历 耻 中 的 -对冲 宽 操 作 倒 过 来 了 ， 央 此 车 行经 
历 中 的 先后 次 序 和 原来 经 历 H 中 的 先后 次 序 不 一 样 。 很 明显 ， 如 果 前 趋 图 PG( 权 中 存在 环 ， 那 
么 对 应 的 经 历 H 不 存在 等 价 的 串 行 经 历 ， 因 为 前 东 图 PG(HD) 中 对 于 任何 串 行事 务 而 言 至 少 有 -- 
条 边 是 向 回 指向 的 。( 该 结论 的 证 明 留 为 本 章 后 面 的 习题 。) 在 接 下 来 的 内 容 中 ， 我 们 将 证 明 
如 果 前 趋 图 PG(H) 中 不 存在 环 ， 那 么 存在 一 个 事务 的 串 行 执行 等 价 于 该 经 历 H。 

定理 10.3.4 ”可 囊 行 性 定理 ”一 个 经 历 H 存 在 等 价 的 串 行 经 历 $9( 瑟 当 且 仅 当 对 应 的 前 趋 图 
PG( 本 中 不 存在 环 。 

证 ”我 们 将 “ 仅 当 ”部 分 的 证 明 留 作 本 章 后 面 的 习题 。 此 处 我 们 证 明 ， 如 果 前 趋 图 PG(H) 
中 没有 环 ， 那 么 存在 事务 的 一 个 串 行 顺序 ， 使 得 前 趋 图 PG(H) 中 不 存 蛮 -- :条 边 对 该 串 行 顺序 而 
言 是 从 后 面 的 事务 指向 前 而 的 事务 的 。 假 定 经 历 中 总 共有 im 个 相关 事务 ， 如 果 有 必要 重新 标记 
PG(UH) 中 的 事务 ， 分 别 忆 为 T，T:  ，T。。 我们 将 对 这 些 事务 重新 排序 以 找到 满足 我 们 要 类 的 
品行 释 历 SCD= Ti To ，Tuwy， 基 中 放 1)，i2)，… ，i(m) 是 对 整数 1,2，…，m 的 重新 排序 。 
我 们 先 假 定 一 个 引 理 ( 稍 后 再 证 明 )， 和 任何 无 环 和 的 有 向 图 G 中 至 少 存 在 一 个 项 点 ,该 顶点 不 存 
在 人 边 【 稍 类 指向 该 项 点 )。 这 意 昧 着 前 趋 图 PG(H) 至 少 有 一 个 顶点 T, 没 有 人 边 。 于 是 我 们 可 
以 选择 这 个 事务 工作 为 串 行经 历 S(H 中 的 第 一 个 事务 Tu。 这 样 做 隐 含 着-- 个 重要 的 限定 属性 ， 
在 PG(H) 剩 下 的 顶点 中 不 存在 一 个 其 他 的 事务 T。( 将 被 放置 在 T 的 右面 )， 在 PG(H) 中 有 一 条 
指向 TD) 的 边 。 现 在 我 们 从 PGCO 中 删除 该 顶点 Ti 以 及 从 工 由 发 的 所 有 边 ， 我 们 将 剩 下 的 图 不 
妨 称 之 为 PG!H)， 其 中 角 标 1 束 示 已 经 有 一 个 顶点 从 原来 的 图 中 删 去 了 。 我 们 应 该 注意 到 
PG(H) 也 具有 充 环 的 特性 【因为 没有 向 PGH) 中 加 人 边 ， 因 此 自然 也 不 会 产生 环 )。 根据 我 们 
的 引 理 ， 在 PG1(D) 中 同样 也 至 少 存在 一 个 没有 人 边 的 顶点 T,'。 我 们 选择 该 顶点 作为 串 行 经 历 
SrH) 的 第 二 个 事务 T。 我 们 要 注意 到 也 许 PG(H) 中 存在 T, 到 To 的 边 ， 得 是 在 PG (本 中 To 不 
存在 人 边 。 这 意味 着 在 将 要 确定 的 串 行 调度 〔 由 PG'(H) 进 一 步 给 出 ) 中 不 存在 从 右 向 左 指 问 
T,, 的 边 。 依 次 逐步 推导 ， 假 定 PG"'(D 中 删除 顶点 T"' 之 后 得 到 PG'(H)， 如 果 PG"H) 不 空 ， 则 
继续 选取 没有 人 边 的 项 点 IT ， 将 Tv 作为 串 行 经 历 S(H) 的 第 r+1 个 事务 Ts。 根据 我 们 的 构 沙 方 
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法 ，PG(H) 中 不 可 能 存在 从 SC) 中 右边 的 事务 指向 SG 中 左边 的 事务 的 边 ， 即 从 Tu 指向 T.。 且 
m>n。 得 到 这 个 序列 的 算法 我 们 称 之 为 拓 直 排序， 在 大 量 的 算法 书 中 都 有 相关 的 表述 。 加 
为 了 完成 定理 10.3.4 的 证 明 ， 我 们 必须 证 明 上 面 提 到 的 引 理 。 


引 理 10.3.5 在 任何 有 限 的 无 环 有 向 图 G 中 ， 必 然 有 一 个 顶点 v 不 存在 人 边 。 


证 ”选择 G 中 选择 任意 一 个 顶点 v ， 庄 人 么 没有 人 边 ， 要 公 存 在 从 顶点 v: 来 的 人 边 。 对 于 v， 
要 人 么 没有 人 边 ， 庄 么 存在 顶点 Y 来 的 人 边 。 以 此 类 推 ， 该 序列 要 委 在 某 个 顶点 ww 终止 ， 即 v, 设 
有 人 进 ， 或 者 该 序列 继续 下 去 。 但 如 果 继 续 这 人 么 推导 下 去 ， 必 然 会 使 基 些 顶点 相关 ， 因 为 图 
只 有 有 限 个 项 点。 假定 当 我 们 标记 顶点 ww 时 ， 我 们 第 一 次 发 现 该 顶点 和 前 面 某 个 标记 过 的 项 
点 vv 相同 ， 续 ic<n。 介 是 这 样 我 们 就 得 到 一 个 环 : vi 一 Y 一 vs 一 一 vv= wa 我 们 已 经 假 
定 图 G 是 没有 环 的 ， 因 此 产生 了 矛盾， 所 凡是 不 可 能 的 。 这 意味 着 我 们 定义 的 序列 推导 本 可 能 无 
限制 地 继续 下 去 ， 必 然 存在 某 个 顶点 ww， 该 顶点 没有 人 边 ， 这 就 是 我 们 所 要 证 明 的 。 加 


10.4 用 来 保证 可 串 行 性 的 锁 机 制 
考察 图 10-8， 这 是 几乎 和 图 10-1 一 样 的 图 ， 我 们 来 做 一 番 讨 论 。 


代表 用 户 发 出 调用 : 
DPEN CURSOR, UPDATE, FETCH 
三 用 程序 SELECT, INSERT DELETE, COMMIT 


WORK, ROLLBACK 。 


在 适当 的 时 候 TM 初 始 化 事务 和 解释 调用 ; 为 事务 T 赋 以 事务 


号 fi 块 定 死 锁 时 寻常 中 目 T 率 务 ， 将 ROLLBACK 操作 转换 
重生 管理 器 (TND) 六 ABOR TIT 调用 

调用 传送 到 调度 器 UPDATE, FETCH SELECT INSERT 

DELETE, ABORT. 


将 所 有 的 兰 用 解 灵 为 读 写 操作 ; 通过 使 用 该 锁 和 扎 
锁 保 证 可 串 行 化 调度 ; 检测 死 锁 并 将 结果 返回 给 
TM 。 





图 10-8 事务 系统 的 层次 结构 图 


在 事务 型 数据 库 系 统 中 ， 通 常 有 大 量 的 用 户 在 终端 上 完成 他 们 的 工作 一 一 用 户 不 会 注意 到 
事务 或 代表 他 们 的 数据 库 调 用 。 通 常 的 执行 过 程 中 ， 应 用 程序 发 出 一 个 代表 某 个 用 户 的 操作 ， 
数据 库 收 到 这 个 操作 之 后 创建 一 个 处 理 该 操作 的 事务 ， 并 给 该 事务 编号 ji 做 这 项 工作 的 数据 
库 系统 模块 称 为 事务 管理 器 ， 或 者 缩写 为 TM， 如 图 10-8 所 示 。 事 务 管理 器 TM 将 诸如 
UPDATE、FETCH、SELECT、INSERT 和 DELETE 这 样 的 操作 传递 给 调度 器 。 

调度 器 的 工作 是 保证 “具有 交错 存 取 操作 的 经 历 H” 中 所 有 事务 的 操作 是 可 申 行 化 的 。 调 
度 器 通过 使 某 些 事 务 操 作 等 待 ， 让 另外 一 些 事 务 操作 先 执行 来 达到 这 一 目标 ， 使 最 终 产 生 的 
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人 经历 H 是 可 串 行 化 的 。 当 某 个 事务 的 操作 被 要 求 等 待 时 ， 相 应 的 用 户 也 必须 处 于 等 待 状 态 ， 但 
是 由 于 时 间 片 内 通常 是 很 短 的 一 段 时 间 ， 用 户 根 本 觉察 不 到 ， 

我 们 已 经 提 芭 过 的 一 个 简单 的 方法 可 以 被 调度 器 用 在 调度 事务 型 操作 上 一 一 产生 严格 的 串 
行经 历 ， 即 保证 一 个 事务 的 所 有 操作 【包括 最 后 的 提交 或 者 回 退 ) 在 任何 后 续 事 务 的 操作 执 
行 之 前 全 部 完成 。 就 像 我 们 在 10.2 节 中 看 到 的 那样 ， 从 系统 性 能 的 角度 出 发 ， 严 格 的 串 行 经 
历 是 非常 不 可 取 的 。 在 本 节 中 我 们 将 解释 调度 器 是 如 何 通 过 加 锁 的 机 制 来 保证 一 个 拥有 大 量 、 
交错 存 取 操 作 的 调度 的 可 串 行 化 的 。 

在 商业 数据 库 系统 中 用 来 保证 事务 一 殖 性 的 .-- 个 非常 著名 的 锁 袖 制 称 为 两 巩 锁 协议 ， 缩 
写 为 2PL， 它 被 大 多 数 商 业 数 据 库 系统 所 采用 。 

定义 10.4.1 ”两 航 锁 协议 ， 即 2PL 以 下 三 条 规则 用 来 规定 在 2FPL 中 是 如 何 申请 和 释放 和 锁 
的 。 

1) 当 事 务 T 试 图 读 取 某 个 数据 项 时， 邵 发 出 操作 R,(A)， 调 度 器 解释 该 操作 并 代表 该 操作 
第 一 次 向 该 数据 项 加 读 锁 RL.(A)。 同 样 ， 当 事务 T, 试 图 对 某 个 数据 项 进行 瑟 (更 新 ) 操作 时 ， 
即 发 出 操作 W,(A)， 调 度 器 解 代表 该 操作 第 一 次 向 该 数据 项 加 写 锁 . WL(A)。” 

2) 在 获得 某 个 数据 项 的 锁 之 前 ， 调 度 距 要 求 请 求 事务 处 于 等 待 状态 ， 直 到 该 数据 项 上 没 
有 冲突 锁 存 在 为 止 。( 冲突 锁 是 由 于 我 们 下 面 将 要 定义 的 冲突 操作 引起 的 。 例 10.4.2 将 向 我 们 
展示 这 样 的 一 个 等 竺 操作 是 如 何 影 响 经 历 执行 的 。) 

同一 数据 项 上 的 两 个 锁 被 称 为 冲突 的 当 生 仅 当 它们 被 不 同事 务 要 求 并 日 这 两 个 销 至 少 一 
个 为 写 锁 。 

3) 如 锁 有 两 个 阶段 : 申请 阶段 ， 在 该 阶段 事务 获得 所 要 求 的 锁 ， 释 放 阶 段 ， 孩 阶段 事务 
释放 拥有 的 锁 。 调 度 器 必须 保证 一 旦 释放 阶段 开始 ， 不 允许 该 事务 再 申请 新 的 锁 。 也 就 是 说 
不 允许 一 个 事务 释放 了 菜 个 锁 之 后 又 去 申请 别 的 锁 。 加 

两 段 尔 理论 的 规则 允许 锁 在 事务 提交 之 前 被 事务 释放 ， 只 要 是 释放 之 后 不 再 申请 新 的 锁 。 
然而 ， 在 大 和 多数 商 业 数 据 库 中 往往 在 提交 阶段 {COMMIT ) 的 最 后 一 下 子 释 放 所 有 的 锁 。 我 
们 假定 在 后 面 的 讨论 中 就 采取 这 个 方法 除非 在 提交 语句 (COMMIT ) 之 前 明确 执行 解锁 操作 
( UNLOCK )。 同 一 个 事务 所 拥有 的 锁 是 不 会 冲突 的 一 一 特别 是 ， 在 一 个 数据 项 上 拥有 读 锁 的 
事务 可 以 进一步 申请 写 锁 ， 只 要 该 数据 项 上 没有 其 他 事物 的 读 锁 存在 。 在 一 个 数据 项 上 拥有 
写 锁 的 事务 是 不 必要 申请 读 锋 的 。 这 一 点 上 ， 我 们 说 读 锁 比 写 锁 要 增 一 点 ， 当 某 个 事务 上 一 
个 已 经 拥有 写 锁 的 数据 项 土 提 交 审 请 读 锁 的 操作 RL(A) 时 马上 会 取得 成 功 。 

冲突 锁 的 定义 很 明显 是 要 保证 执行 冲突 操作 的 两 个 事务 是 可 串 行 化 的 ， 以 人 恒 对 应 的 前 趋 
图 中 不 会 产生 环 。 当 两 个 事 血 在 某 个 数据 项 上 有 冲突 覃 作 时 ， 先 访问 该 数据 的 溃 务 就 先 取 得 
相应 的 锁 先 执行 ， 而 在 该 经 历 对 应 的 任何 一 个 等 价 串 行 经 历 中 另 一 个 事务 就 必须 在 前 一 个 事 
务 的 后 面 了 。 如 果 第 二 个 事务 拥有 第 一 个 事务 在 稍 后 的 执行 中 需要 的 一 个 锁 ， 那 么 就 会 寻 致 
死 锁 ， 这 样 其 中 -个 事务 就 必须 异常 中 止 。 蜡 常 中 止 的 事务 将 从 经 历 中 删除 在 前 赵 图 中 也 
将 删除 相应 的 顶点 )， 以 便 结 果 是 可 串 行 化 的 。 因 此 两 段 锁 原 理 保 证 了 一 个 可 串 行 化 的 经 历 。 
在 我 们 严格 地 展示 这 一 点 之 前 我 们 需要 处 理 死 锁 问 题 。 

日” 尽管 读 锁 和 写 镇 在 于 辑 上 已 经 充分 ， 但 在 一 些 数据 库 系统 中 往往 还 引 人 了 许多 其 他 类 型 的 锁 ， 称 之 为 粒度 


销 或 多 粒度 钙 或 意向 锁 ， 这 些 孝 超出 了 本 书 所 讲述 的 范围 。 可 以 参考 本 章 后 而 的 推荐 读 果 [站 和 [2]， 专 门 
对 这 些 锁 进 行 了 讨论 。 
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首先 ， 我 们 想 说 明定 义 10.4.1 中 第 3 条 规则 的 重要 性 ， 该 规则 弗 求 事务 加 锁 时 申请 锁 阶 段 
后 面 跟 一 个 释放 锁 阶 段 。 对 于 锁 机 制 面 言 ， 这 个 “两 段 规 则 ”对 于 保证 经 历 的 可 串 行 化 有 着 
重要 的 意义 。 

例 10.4.1 让 我 们 回想 一 下 在 例 10.3.1 中 向 大 家 展示 的 那个 不 可 串 行 化 的 经 历 H1。 下 面 是 
对 经 历 Hl 中 的 操作 进行 重新 排序 之 后 的 得 到 经 历 H1'， 这 个 经 历 也 是 不 可 串 行 化 的 。 

H1 = RtA) R2(B) Wat{B) Ro(A) WotA} RB) C1 C2 


现在 我 们 要 证 明 如 果 人 允许 该 经 历 违 反 “ 两 段 规则 ， 和 那么 我 们 可 以 使 得 该 经 万 在 执行 锁 机 
制 时 满足 其 余 的 规则 ， 而 是 这 个 不 可 串 行 化 的 经 历 H1' 仍 能 得 到 执行 。 为 了 说 明 锁 操作 ， 我 们 
在 扩展 的 经 历 H1' 中 加 入 了 一 些 关 于 锁 的 操作 。 操 作 RL 代 表 获 取 读 锁 ， 操 作 WL 代 表 获 取 写 锁 ， 
操作 RU 代表 释放 一 个 读 锁 ， 操 作 WU 代 表 释 放 一 个 写 锁 。 因 此 RL(A) 代 表 惠 务 T, 对 数据 项 A 加 
读 锁 ，wWU:(A) 代 表 事 务 T, 释 放 数 据 项 A 上 的 写 锁 。 通 常 ， 我 们 假定 一 个 种 务 拥有 的 所 有 的 锁 
在 该 事务 的 提交 阶段 一 起 释放 。 下 面 是 扩展 的 经 历 H1': 

H1’:: RUA RiIA) RUNA) RL2tB)} RatB) WL2tB} WaiB) WatB) RL2AA) RaziAi WtzIAi WalA) 

RL1{B)RA(B) C1 Cz 


在 这 个 扩展 的 经 历 中 每 个 事务 在 进行 读 写 操作 前 都 执行 了 相应 的 加 锁 操 作 ，REL 或 WEL。 
因此 定义 10.4.1 中 的 规则 1 得 到 满足 。 此 外 规则 2 也 是 满足 的 , 因为 在 向 个 事务 授予 某 个 锁 时 ， 
该 数据 项 上 不 存在 相 溃 突 的 已 经 授 寺 其 他 事务 的 锁 。 经 历 HT' 中 的 第 3 个 操作 RU.(A) 释 放 了 A 
土 的 读 锁 ， 以 免 和 该 经 历 的 第 11 个 操作 WEL:(A) 相 冲突 。 同 样 地 ， 第 8 个 操作 WU:(B) 释 放 了 B 上 
的 写 锁 ， 以 免 和 该 经 历 的 第 13 个 操作 RL(B) 相 冲突 。 丰 该 扩展 经 历 中 唯一 违反 的 规则 就 是 : 
“ 催 段 规则 ”， 因 为 两 个 事务 都 在 释放 了 某 个 锁 之 后 又 申请 了 别 的 锁 。 这 说 明了 “两 段 规则 ” 
对 于 通过 锁 机 制 来 保证 经 历 的 可 串 行 化 有 着 重要 的 作用 。 畏 


等 符 图 

等 待 攻 是 由 许多 事务 型 锁 调 度 器 维护 的 一 个 月 阿 图 ， 顶 点 由 当月 所 有 活动 事务 组 成 ， 项 
点 T, 到 的 边 T 一 TT 代表 事务 TT 正在 等 待 对 某 个 数据 项 加 锁 ， 而 该 数据 项 当前 被 事务 T 锁 定 着 。 
当下 刑事 件 发 生 时 ， 调 度 器 对 等 待 图 进行 更 新 : (1 ) 一 个 新 的 事务 产生 ( 新 的 顶点 将 被 如 人 
到 等 待 图 中 )。( 2 ) 一 个 事务 被 迫 进 入 等 待 状态 ( 一 条 新 的 边 加 入 到 等 竺 图 中 )。{ 3 ) 一 个 老 
的 事务 提交 《对 应 的 顶点 将 从 等 待 图 中 删除 ， 该 事务 拥有 的 锁 将 全 部 释放 ， 每 个 数据 项 的 等 
待 队列 中 的 第 一 个 事务 将 获得 相应 的 锁 ， 这 可 能 将 导致 其 他 事务 等 待 这 个 新 的 事务 宏 放 锁 ， 
但 该 算法 是 相对 有 效 的 )。 当 等 待 图 中 呈现 回路 时 ， 就 意味 者 产生 死 锁 。 

调度 器 会 在 等 待 图 发 生变 化 后 的 一 定时 间 内 检测 等 竺 图 中 是 否 有 回路 ( 有 了 内 也 穆 为 环 ) 
存在 。 如 果 有 同 路 存 在 ， 调 度 器 就 会 选择 某 些 事务 作为 往 牲 品 ， 证 其 强行 异常 中 止 。 选 择 轿 
牧 品 的 标准 可 以 是 各 种 各 样 的 ; 中 正 最 年 轻 的 事务 、 中 止 已 经 完成 的 操作 最 少 的 事务 等 等 。 

例 10.4.2 ”我 们 再 次 引用 例 10.4.1 中 不 可 串 行 化 的 经 历 H1'。 当 应 用 2PL 原 则 时 会 发 生 什 么 
情况 呢 ? 

H1 = RA) RzfB] Wo(B) RotA} WalA} RHB) C1 C2 

应 用 2PL 上 原则 后 ， 经 历 H1' 引 起 以 下 一 系列 的 事件 : 

RL (AYR CA) RLAB) RAB)Y WLABY WAB) RLAA) RJA) WL,(A) (与 前 面 的 RLA) 相 冲突 ， 
因此 T, 必 须 等 待 ) RL (BY) (与 前 而 的 WL,(B) 相 冲突 ， 雪 此 T, 必 须 等 待 ， 这 样 等 待 图 中 就 出 现 


一 -一 -一 一 号 一 一 m-u 一 一 一 - 


禄 1J0 间 更 新 圳 阁 3475 


回路， 于 是 我 们 必须 异常 中 止 某 个 事务 一 一 比如 选择 T, 作 为 牺牲 品 ) A(T 拥 有 的 锁 全 部 释 
放 ， 于 是 导致 了 ,等待 的 操作 WL:(A) 现 在 可 以 执行 了 ) W,(A) C; (假定 事务 T, 的 工作 重新 开始 ， 
并 标记 为 事务 T, ) RL,(A) RCA) RL,(B) RA(B) C,。 

其 度 器 通过 强行 等 符 和 蜡 常 中 止 一 个 事务 并 在 稍 后 重新 抽动 该 事务 的 方法 ， 使 得 两 个 事 
务 最 终 都 能 成 功 运 行 。 图 

定理 10.4.2 ”加 锁定 理 ”遵守 2PL 原 则 的 事务 型 操作 经 历 必 定 是 可 串 行 化 的 。 国 

很 明显 ， 这 是 一 个 重要 的 定理 ， 因 为 大 多 数 商 业 数 据 库 系 统 中 对 事务 隔离 性 的 保证 依赖 
于 这 个 定理 的 绪论 - 在 证 明之 前 ， 我 们 先 来 证 明 一 个 重要 的 引 理 。 

引 理 10.4.3 ”假定 H 是 一 个 遵守 2PL 协 议 的 事务 操作 上 经历 (我们 称 之 为 2PL 经 历 )。 如 果 在 
经 历 再 的 前 趋 图 PG(HD 中 存在 一 条 边 T 一 T， 那 么 必然 存在 某 个 数据 项 D， 经 历 H 中 存在 该 数据 
项 的 两 个 冲突 操作 X,[D] 和 Y,[D]， 使 得 XD]<<,Y[D]。 

证 ”由 于 存在 边 T 一 T,， 根 据 前 趋 图 和 冲突 操作 的 定义 ， 必 然 存在 两 个 冲突 操作 多.[DJ 和 
YID]， 使 得 X,[D]<<sY,[D]。 根 据 两 段 锁 的 定义 ,其 中 任何 一 个 操作 必然 存在 加 锁 和 解锁 的 操 
作 ， 如 XL[D]<<,XD]<<sXU,[D] 和 YLAD]<<wY,[DI<< sYUILD]。( 解锁 操作 也 许 隐 含 在 事务 的 
提交 操作 中 ， 但 是 我 们 选择 了 在 经 历 H 中 明确 表示 出 六 ， 使 它们 出 现在 提交 操作 的 前 面 。) 

现在 考虑 对 于 出 现在 XLAD]<<nXID]<<aXU[D] 中 的 操作 ， 数 据 项 DD 上 的 X 锁 被 事务 T 拥 
有 ; 对 于 出 现在 YL[D]<<sY,[Dl<< nYU[ID] 中 的 操作 ， 数 据 项 D 上 的 了 镇 被 事务 TT 拥有。 因为 
操作 六 和 YY 是 冲突 的 ， 因 此 相应 的 锁 也 是 冲突 的 ， 因 此 这 两 个 锁 的 存在 时 间 不 能 重生 但 是 根 
据 X,[D]<<sY[D]， 这 两 个 操作 的 加 锁 必 须 按 以 下 次 序 发 生 : 

XILID| <<H KD] <<H XUi[D] <<H YULID] <<H VID] <<H YUIIDD] 

于 是 引 理 所 阐述 的 内 容 得 到 证 明 。 国 

有 了 这 个 引 理 我 们 可 以 证 明定 理 10.4.2。 

定理 10.4.2 证 ”我 们 所 要 证 明 的 是 每 个 2PL 经 历 都 是 可 串 行 化 的 。 息 定 这 个 结论 不 成 立 ， 
那么 必然 存在 一 个 2PL 经 历 H， 该 经 历 对 应 的 前 赵 图 PG(H) 存 在 环 丰 一 T 一 … T,-> Ti。 根据 引 
理 10.4.3， 对 于 前 盐 图 PG(H) 中 的 每 一 对 事务 T, 一 Ti ， 必 然 存 在 某 个 数据 项 D,， 使 得 
XU,[D]<<nsYL,. IDP,]。 对 于 所 有 的 KE， 我 们 可 以 将 该 序列 按 以 下 形式 写 出 来 : 


1., XUIID1| tH YL2{D1!} 
2 XU2[D2l <<H YL3lD2l 
n-1. XU_ID il <<H YLno[Dn-1] 
nn. XULDn] <<H YL1[Dn] 


根据 两 段 锁 和 协议。 任何 事务 T 的 所 有 加 锁 必 须 在 解锁 之 前 完成 。 根 据 第 1 行 和 第 2 行 ， 事 务 
T, 分 别 在 数据 项 D, 和 D, 上 进行 加 锁 和 和 解锁， 根据 两 段 锁 性 质 我 们 可 以 断定 YL,[D,]<<wXU;[D,]。 
据 此 ， 我 们 可 以 进一步 由 第 1 行 和 第 2 行 的 事实 以 及 传递 性 得 到 ; 

XUDI] <<H YL3[D51 

换 和 旬 话 说， 在 事务 T, 对 某 个 数据 项 加 锁 之 前 ， 事务 TT, 对 另外 某 个 数据 项 执行 了 解锁 。 以 此 
类 推 直到 第 n 和 17， 我 们 可 以 进一步 得 出 结论 :; 


KUO az YiD] 
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但 是 这 -~ 结论 违反 了 事务 T, 的 所 有 加 锁 必 须 在 解锁 之 前 完成 的 两 段 锁 性 质 。 因 为 我 们 假 
定 这 是 一 个 2PL 经 历 ， 导 致 子 盾 ， 所 以 前 趋 图 PG(H) 中 不 可 能 存在 环 。 因 此 经 历 耳 必定 是 可 
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定理 10.4.2 告 讨 我 们 一 个 幸 度 大 通 过 应 用 两 段 锁 协议 可 以 保证 产生 可 串 行 化 的 经 历 。 这 意 
味 着 对 和 任何 数据 的 读 写 操作 ， 调 度 器 都 将 代表 该 事务 先 申 请 对 该 数据 的 读 锁 或 写 锁 ， 并 月 调 
度 器 将 一 直 保留 这 些 获 得 的 锁 直 到 能 够 将 它们 安全 释放 为 止 。2PL 协 议 的 第 3 条 性 质 确 保 一 个 
事务 不 能 在 释放 一 个 锁 之 后 又 去 申请 不 同 的 锁 ， 因 此 我 们 必须 保留 所 有 的 已 经 获得 的 锁 直 到 
没有 新 的 数据 访问 操作 产生 为 止 。 事实 上 ， 我 们 假定 一 个 事务 保留 所 有 属于 该 事务 的 锁 直 到 
该 事务 提交 或 者 异常 中 止 。 

然而 ,保证 很 好 的 串 行 性 的 调度 对 性 能 有 较 大 的 影响 。 当 我 们 加 入 更 多 的 绑 程 以 及 并 发 
事务 时 ， 特 别 是 这 些 事 务 外 理 大 量 的 常用 数据 时 ， 对 数据 的 存 取 就 会 产生 大 量 的 重 委 ， 锁 冲 
罕 意 味 着 越 来 越 多 的 事务 处 于 等 待 状 态 。 随 着 并 发 性 的 增加 死 锁 的 次 数 也 随 之 增加 ， 蜡 常 中 
止 某 些 事务 并 在 随后 重新 启动 这 些 事务 在 很 大 程度 上 是 对 计算 机 资源 的 浪费 。 但 事实 上 更 严 
重 的 问题 是 伴随 着 大 量 的 并 发 活动 事务 ， 越 来 越 多 的 事务 会 由 于 锁 的 冲突 进 和 等待 状态。 
在 某 些 情况 于 这 一 效果 很 快 会 得 到 证 明 ， 如 果 我 们 为 了 事务 的 并 发 增加 线程 ， 我 们 事实 上 减 ， 
少 了 处 于 等 竺 状态 的 活动 的 并 发 事务 的 数量 。 性 能 问题 不 是 因为 异常 中 小 某 些 事务 而 又 再 次 
重新 府 动 所 浪费 的 CPU 资源 ， 而 是 因为 CPU 从 来 没有 被 充分 地 使 用 ， 这 是 由 于 我 们 没有 获得 
足够 有 效 的 并 发 度 来 保证 活动 事务 的 事务 逻辑 通过 LO 的 重合 而 合 CPU 保 持 繁 位 状态 。 

由 于 这 个 原因 ， 多 年 前 大 们 提出 数据 库 系 统 的 事务 调度 器 应 该 降低 两 段 锁 协议 的 要 求 ， 
从 而 降低 事务 间 由 于 访问 神 突 而 产生 的 等 待 。 先 假定 这 种 弱化 可 以 增加 有 效 的 并 发 。 当 然 通 
过 较 弱 的 规则 要 求 ， 我 们 将 不 能 对 事务 的 隔离 性 提供 强 有 力 的 保证 ， 这 样 就 有 可 能 使 那些 具 
有 冲突 操作 的 事务 相互 影响 产生 不 一 致 的 结果 ， 而 这 在 严格 品行 执行 时 是 不 会 发 生 的 。 但 是 ， 
现在 各 种 弱化 的 形式 却 已 经 是 不 争 的 事实 ，ANSI SQL-99 标 准 支 持 一 种 称 为 隔离 级 别 的 特性 。 
(注意 ，SQIL-99 标 准 定义 的 隔离 级 别 与 早期 定义 的 隔离 度 (0, 1*, 2", 3") 有 很 太 的 不 同 ， 隔 离 度 
在 一 些 产 品 中 仍然 在 以 不 同 的 名 称 使 用 。 参 见 Gray 和 和 Reuter 的 文章 (推荐 读物 [2] )。 

在 SQL-99 的 语法 中 允许 在 启动 事务 (访问 任何 数据 ) 的 SQL 语句 之 前 设置 隔离 级 别 ， 使 
用 的 语句 通常 为 Set Transactioa 语 句 。 以 下 是 SQL-99 提 供 的 四 个 隔离 级 别 ， 向 程序 员 依次 提供 
更 高 的 隔离 保证 级 别 和 限制 ; 

1) Read Uncommitted (有 了 时 也 称 为 “ 脏 ” 读 }。 

2) Read Committed ( 比 DB2 的 “游标 稳定 ”隔离 级 别 要 恰 一 些 )， 

3) Repeatable Read. 

二) Serializable , 

最 后 一 个 隔离 级 别 4)Serializable 等 价 于 我 们 在 定义 10.3.4 和 10.4.2 中 定义 的 可 串 行 性 ， 然 
而 前 面 三 个 隔离 级 别 1) 、2)?、3) 要 显得 更 为 宽松 ， 因 此 也 提供 了 较 低 的 隔 高 保证 。ANS1 SQL- 
99 标 淮 的 Set Transaction 语 句 格 式 如 下 : 


SET _ TRANSACTION {READ ONLY | READ WRITE} 
1SOLATION LEVEL {READ UNCOMMITTED | READ COMMITTED | REPEATABLE READ | 


SERIALIZABLE] ， 
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一 个 只 读 事务 在 它 的 执行 过 程 中 不 能 有 任何 更 新 操作 ( 如 果 有 更 新 操作 会 导致 错误 信息 )， 
然而 读 写 事务 是 允许 更 新 的 。 事 务 的 隔离 级 别 和 执行 更 新 操作 的 能 力 通常 是 分 别 定义 的 ， 只 
有 在 隔离 级 别 READ UNCOMMITTED 下 更 新 操作 是 不 允许 的 。 下 面 我 们 将 逐一 讨论 这 些 隔 离 
级 别 ， 看 看 它们 之 间 到 底 有 哪些 不 同 之 处 。 

在 接 下 来 讲述 的 内 容 中 我 们 需要 理解 短期 贺 (short-term lock ) 的 概念 。 实 际 上 ， 数 据 项 
上 的 短期 锁 只 是 在 执行 相关 存 取 操作 的 一 段 足够 长 的 时 间 内 保留 。 例 如 事务 将 完成 RL,(A) 
RA RU(A) 序 列 。 对 于 这 种 锁 ， 仅 仅 当 拥有 该 锁 的 事务 正在 执行 该 操作 时 才 会 阻塞 其 他 试图 
访问 该 数据 的 事务 ， 当 然 即 使 是 申请 短期 锁 的 事务 ， 也 必须 等 待 该 锁 直 到 被 授予 为 小 (这 时 ， 
该 数据 项 上 已 经 没有 其 他 事务 的 冲突 操作 存在 了 }。 由 于 大 多 数 事务 会 访问 儿 个 数据 ， 因 此 申 
请 短期 锁 的 事务 往往 不 满足 两 段 镇 协议 的 第 3 条 规则 ， 所 以 有 可 能 产生 不 可 串 行 化 的 行为 。 当 
然 这 是 低 隅 离 级 别 的 极 病 情况 ;: 我 们 往往 假定 在 弱 隔 离 保 证 不 至 于 产生 负面 影响 的 情况 下 才 
使 用 较 低 的 隔 访 级 别 。 相 对 于 短期 锁 的 男 一 种 锁 是 长 期 锁 (1ong-term lock )， 这 种 锁 将 一 直 保 
留 直 到 事务 提交 为 止 。 

图 10-9 列 出 了 SQL-99 各 个 隔离 级 别 下 哪些 锁 应 该 作为 长 期 锅 。( 不 作为 长 期 锁 的 以 短期 锁 
对 待 )。 在 图 10-9 中 ， 我 们 将 对 整个 数据 库 表 上 的 记录 加 锁 和 对 满足 某 个 谓词 的 记录 (比如 
city='Boston' 的 记录 ， 这 些 谓词 往往 出 现在 WHERE 子 名 中 ， 用 来 确定 要 对 鄂 些 记录 进行 
读 和 修改 ) 训 锁 这 两 种 操作 区 别 对 待 。 我 们 要 指出 的 是 为 了 保证 真正 的 可 串 行 化 我 们 需要 在 
谓词 上 加 锁 ， 就 像 在 数据 项 上 加 锁 一 样 ; 我 们 将 在 下 面 涉 及 可 串 行 化 的 了 前 离 级 别 时 讨论 这 -- 
点 。 作 为 将 要 讨论 的 内 容 的 一 个 简单 预览 ， 我 们 将 会 发 现 我 们 需要 谓词 锁 来 避免 特定 的 诸如 
“ 畴 灵 问 题 ” 这 样 的 不 可 串 行 化 问题 。 





记 东 下 的 号 记录 上 的 读 谓词 | 的 读 锁 和 写 
锁 为 长 期 锁 锁 为 长 期 锁 锁 为 区 期 锁 
[ 


短期 读 谓 词 锁 
| 长 期 该 谓 词 锁 












图 10.9 SQL-99 隔 高 级 别 中 的 长 期 锁 行 为 


对 于 事务 调度 器 而 言 ， 在 同一 个 事务 执行 环境 中 支持 具有 不 同 隔离 级 别 的 不 同事 务 并 发 
执行 是 完全 可 能 的 。 这 也 是 SQL-99 标 准 之 所 以 允许 程序 员 在 程序 中 使 用 Set Transaction 语 句 并 
在 后 继 事务 开始 执行 之 前 重新 设置 事务 了 阅 离 级 别 的 原因 。 不 同 的 进程 可 以 以 不 同 的 隔离 级 别 


急需 要 注意 的 是 SQL-99 标 准 并 没有 利用 锁 的 行为 来 定义 隔离 级 别 。 取 而 代 之 的 二 以 许多 英语 中 的 现象 来 表达 
事务 的 不 规则 ， 并 根据 各 个 隔离 级 别 中 可 能 出 现 的 这 些 现象 来 措 述 这 些 毅 离 级 别 。 然 而， 这 样 定 义 陋 高 级 
别 明 有 缺陷 的 (参考 本 童 后 面 的 推荐 读物 [5] )， 在 此 处 我 们 只 提供 从 锁 的 角度 对 隔离 级 别 的 定义 。 但 这 并 
不 意 昧 着 锁 机 制 是 实现 各 种 阳 离 级 别 的 唯一 方法 。 锁 机 制 是 大 多 数 商业 数据 库 科 用 的 方式 ， 伯 不 是 唯 -的 


方式 。 
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执行 各 目的 代 怡 ， 但 是 一 切 都 会 按照 我 们 所 期 望 的 闭 样 运行 。 

1. Read Uncommitted 隔 离 级 别 

从 图 10-9 的 第 一 行 ， 我们 可 以 看 到 以 Read Uncommitted 隔 离 级 别 执行 的 事务 无 论 访问 什 
么 数据 都 不 加 锁 。 看 上 去 这 似乎 会 导 敏 脏 写 的 现象 {参见 例 10.3.2 )。 对 那个 例子 中 的 经 历 H2， 
我 们 重新 来 考察 各 个 数据 项 的 值 ， 一 个 事务 对 数据 项 A 的 写 操作 的 结果 被 男 外 一 个 事务 对 A 的 
写 操作 覆盖 ， 而 这 两 个 事务 在 写 操 作 之 前 读 到 的 是 相同 的 A 值 。 

H2 = Ri{A, 100) Roa(A, 100) Wi1{A, 140} Wal{A, 150) C1 C2 

这 样 两 个 事务 对 一 个 账户 余额 的 钊 新 产生 相互 于 扰 ， 导 和 化 一 个 事务 增加 40 的 操作 结果 被 
为 一 个 事务 增加 50 的 操作 覆盖 ， 总 共 应 该 增加 90 的 结果 丢失 。 然 而 这 个 问题 在 SQL-99 标 准 中 
的 Read Uncommitted 怖 离 级 别 下 不 会 发 生 ， 因 为 在 此 隔离 级 别 下 更 新 操作 是 不 允许 的 。 如 果 
执行 了 以 下 的 Set Transaction 语句 ， 

set tranrsaction isolation level read uncommitted,; 

那么 事务 中 的 更 新 操作 缺 省 地 变 成 只 读 的 ( 注意 ， 在 其 他 随 离 级 别 下 更 新 操作 具有 读 写 
属性 )。 此 外 ， 加 果 Set Transaction 语 名 如 下 所 示 : 


set transaction read write isolation Tevel read uncommitted: 


联 会 导致 钳 误 。 一 个 Read Uncommitted 事 务 是 不 允许 更 新 数据 的 。 因 此 经 历 Hz 中 的 脏 写 
是 不 会 发 生 的。 

然而 ， 读 腻 的 确 有 可 能 发 生 。 银 行 里 读 取 账户 余额 数 并 进行 求 和 操作 的 事务 ， 会 忽略 任 
何其 他 事务 在 这 些 数据 上 可 的 锁 ， 因 此 有 可 能 读 到 林 被 提交 的 数据 。( 我 们 可 以 注意 到 在 图 
10-9 中 Read Uncommitted 隔 离 级 别 下 不 需要 申请 任何 锁 就 可 以 访问 数据 ， 人 页 到 其 他 事务 的 写 
操作 也 无 须 等 待 ， 而 只 是 简单 地 忽略 这 些 锁 。 国 此 定义 10.4.1 中 的 属性 [12]1[3] 都 被 忽略 了 。) 
结果 是 ,一 个 Read Uncommijtted 的 事务 计算 账户 总 余额 的 操作 可 能 导致 一 个 无 效 的 数据 ， 因 
为 它 可 能 读 到 了 无 效 的 中 间 结 果 。 当 然 这 个 结果 是 不 会 让 -个 希望 得 到 确切 结果 的 核算 人 员 
满意 的 。 和 但 也 许 对 于 银行 经 理 来 说 没什么 大 的 关系 ， 因 为 他 只 是 每 个 星期 过 问 一 下 银行 的 总 
余额 。 

2. Read Committed 隔 离 级 别 和 游标 稳定 性 

在 图 10-9 的 第 二 行 ， 我 们 可 以 看 到 Read Committed 隔 离 级 里 下 写 炙 作 为 长 期 锁 ， 而 读 锁 
只 是 短期 锁 。 这 使 得 我 们 在 图 10-7 中 看 到 的 并 发 事务 之 间 产 生 的 三 种 冲突 操作 中 的 两 种 不 会 
发 生 : (2) WA) 一 RHLA) 和 (3) WA) 一 WA)。 在 这 一 隔离 级 别 下 一 个 事务 丰 能 读 或 者 写 一 
个 已 经 被 其 他 事务 写 过 的 数据 ， 直 到 那个 事务 提交 为 止 。 特 别 是 不 读 未 提交 的 脏 数 据 ， 只 能 
读 取 已 经 提交 的 事务 写 过 的 数据 。 这 也 说 明了 该 隔离 级 别 的 名 字 “Read Committed”， 同 样 前 
一 隔离 级 别 的 名 字 “Read Uncommitted” 也 可 以 按 这 种 思路 理解 ， 读 取 未 提交 的 更 新 数据 是 
可 能 的 。 在 Read Committed 隔 离 级 别 下 一 条 记录 上 可 能 产生 的 唯一 的 冲突 操作 是 (1) RAA) 一 
WA)。 那 么 什么 样 的 异常 情况 会 在 该 隔离 级 别 下 发 生 ， 而 不 会 在 -个 串 行经 历 中 发 生 呢 ?下 
而 两 个 例子 解释 了 两 种 这 样 的 异常 。 


例 10.5.1 ”不 可 最 复读 异常 “考虑 一 个 事务 ， 它 在 一 组 行 上 打开 了-…. 个 游标 并 依次 读 取 后 
续 行 的 值 ， 然 后 再 次 在 这 组 行 上 打开 游标 第 二 次 读 了 到 这 些 行 的 值 。 我 们 会 发 现在 Read 
Committed 隐 离 级 别 下 两 次 遍历 游标 读 到 的 数据 可 能 不 完全 一 样 。 在 Read Committed 级 别 下 ， 
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一 个 事务 只 是 开 读 取 数据 的 过 程 中 持 有 读 钞 ， 一 日 读 操 作 完成 就 会 释放 相应 的 锁 。 因 此 极 有 
可 能 其 他 事务 在 该 事务 的 两 次 打开 游标 操作 之 间 更 新 了 数据 。 下 面 通过 一 个 党 值 的 扩展 经 历 
来 说 明 这 个 间 题 ， 这 个 经 历 中 事务 Ti 只 读 -个 数据 项 A: 

H4=R (A,SO)WA(A, B80})C, Ri(A，80)C 国 

这 一 异常 ， 通 党 称 之 为 非 可 重复 读 。 

不 可 重复 读 对 于 天 多 数 数据 库 应 用 来 说 可 能 并 不 是 什么 问题 ， 册 为 对 于 一 个 应 用 来 说 很 
少 禹 要 对 一 个 数据 读 两 次 。 我 们 给 出 这 个 例子 的 一 个 主要 原因 是 因为 下 一 个 更 强 的 隔离 级 别 
是 可 重复 访 Repeatable Read， 许 多 教科 书 使 用 该 例子 中 的 经 历 H4 来 说 明 这 两 个 隔离 级 别 的 区 
别 。 然 而 ， 在 Read Committed 级 别 下 可 能 会 发 生 更 为 严重 的 错误 ， 与 经 历 H2 中 的 于 失 蝎 新 有 
得 一 比 。 

例 10.5.2 学 究 丢失 更 新 异常 回忆 一 下 在 经 历 H2 中 说 明 的 孙 失 更 新 噶 兹 : 

H2 = Ri{A, 100) RzIA, 100) Wi (A, 140 WolA, 150) Ci C。 


在 Read Committed 级 别 下 ， 这 类 异常 是 不 会 发 生 的 ,不 是 因为 读 写 之 间 的 任何 冲突 ， 而 
是 由 于 写 锁 是 长 期 锁 ， 因 此 操作 W2(A,150) 不 可 能 覆盖 事务 了 对 A 设 置 的 140。 然 而 我 们 再 来 
考虑 如 下 的 经 历 H5: 

H5 = Ri(A, 100) Rz(A, 100) Wi (A, 340) Ci WatA, 150) C» 

因为 在 坪 务 T, 试 图 覆盖 A 之 前 T 已 经 提 伙 ， 肯 也 没有 写 锁 来 阻 止 天 和 失 更 新 异常 的 发 生 了 。 
HS 是 应 用 中 一 种 非常 典型 的 错误 ， 因 此 说 明了 Read Committed 级 别 下 一 个 非常 严重 的 错误 。 
串 实 二 ， 如 果 进 信 锁 调度 器 中 的 序 州 如 经 历 H2， 那 么 最 终 得 到 的 序 州 叮 能 是 H5， 因 为 当 
WA( 太 ,15 人 0) 出 现在 调度 器 中 时 ,调度 器 会 让 事务 T, 等 待 直到 事务 T, 提 交 为 止 ， 结 果 足 产生 加 
同 H5 这 样 的 经 历 。 我 们 称 这 种 异常 为 “学 究 丢 失 更 新 ”， 从 而 有 别 于 经 历 H2 中 的 丢失 更 新 。 
H5 并 没有 和 H2 有 什么 多 大 的 不 同 ， 因 此 “学 究 ” 一 词 只 是 戏称 而 已 ， 就 稼 贷 赛 中 的 “学 究 
对 手 ” 一 词 。 加 

DB2 和 其 他 许多 数据 库 产品 提供 了 称 为 游标 稳定 性 (cursor stability) 的 网 离 级 别 ， 该 级 别 比 
Read Committed 要 稍微 严格 一 些 。 就 像 Read Committed 一 样 游标 稳定 性 将 写 锁 作 为 长 期 锁 ， 而 
读 锁 不 是 长 期 锁 ; 但 是 它 能 阻止 出 10.5.2 中 的 学 究 丢 失 更 新 ， 只 要 所 有 的 数据 更 新 操作 是 通过 
游标 进行 的 ( 即 ，UPDATE...WHERE CURRENT OF CURSOR... )。 名 字 游 标 稳定 性 来 源 于 一 
种 特别 类 型 的 锁 ， 这 种 锁 比 读 锁 要 强 一 点 ， 加 在 通过 游标 读 取 的 数据 上 ， 即 使 数据 已 经 被 读 
取 仍 然 保 留 该 锁 直 到 游标 移 到 下 一 行 。( 当然 ， 如 果 在 游标 移 到 下 一行 之 前 要 对 当前 行进 行 更 
新 ， 那 么 在 当前 行 保留 写 锁 。) 这 一 加 锁 并 没有 阻止 非 可 重复 读 的 异常 。 然 而 ,在 图 10-10 中 的 
给 SFBay 支 行 的 每 个 人 增加 $10.00 利 息 的 代码 不 会 出 现 丢 失 更 新 的 异常 ， 因 为 对 游标 的 当前 行 
始终 保留 相应 的 锁 。 

我 们 也 可 以 采用 图 10-11 的 Read Committed (甚至 在 Read Uncommitted ) 事务 隔离 级 别 下 
的 单条 语句 更 新 来 避免 丢失 上风 新 异常 ， 因 为 Update 语 句 在 更 新 过 程 中 会 保留 每 行 上 的 锁 ; 读 
操作 和 写 操 作 作 为 一 个 原子 操作 对 逐个 执行 。 

然而 ， 图 10-12 的 更 新 单行 的 代码 仍然 可 能 产生 技 失 更 新 异常 ， 即 使 采 珠 游标 稳定 性 也 不 
能 幸免 。 内 为 在 第 一 条 语句 读 了 该 数据 后 (不 通过 游标 恋 )， 在 第 二 条 语句 对 其 史 新 之 前 ， 没 
有 对 该 数据 进行 加 锁 。 
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Bxec Sql declare cursor deposit for select balance from accounts 
where branch_ id ~ ‘SFBay’ for update of Dalance: 
Et S91 站 Pen cs 


tnow leop through rows in cursor, and for each pass do} 


exec Sql fetch ¢ fnto :balance: 
balance = balance + 10.0; 
让 其 BC sql update account set balance = :balance 
Where current of deposit: 
‘iend of loo0p} 
Xp 591 Close deposi1t: 
Exec Sql commit work: 





阁 10-10 在 游标 稳定 性 隔离 级 别 下 无 丢失 更 新 的 逻辑 


exect sql Update accounts set balance = balance + 10.00 
where branch id = 'SFBay’: 
exec S91 commit work; 





图 10-1] 在 Read Uncommitted 后 启 级 别 下 无 于 和 兴 更 新 的 充 辑 


exec sql select baiance into :balance from accounts 
whera acct. id 一 “内 12347 

balance = balance + 10.00:; 

EXEC $1 update accounts set balance = :halance 
where acct_id = “Al244"; 





exec sql COmmit work: 


图 10-12 在 游标 稳定 性 隅 离 级 别 下 可 能 丢失 更 新 的 欣 辑 


似乎 并 非 所 有 使 用 Read Committed 隔 离 级 别 的 程序 员 都 会 意识 到 下 能 发 生 异 常 ， 因 为 游 
标 稳 定性 的 优点 似乎 被 ANSI SQL 委员 会 过 高 估计 了 ， 使 用 Read Committed 隔 离 级 别 的 数据 库 
没有 必要 提供 游标 稳定 性 。 对 于 一 个 DBA 而 言 可 以 对 正在 使 用 的 任何 数据 库 进 行 测试 ， 看 使 
用 了 游标 之 后 例 10.5.2 是 否 会 发 咎 异常 ， 这 实在 是 个 好 主意 。 

3. Repeatable Read 陋 高 级 别 

图 10-9 的 第 三 行 显示 Repeatable Read 隔 离 级 别 支 持 对 单个 数据 项 〔 比如 行进 行 两 段 加 鳃 
的 所 有 要 求 ; 它 对 所 有 的 数据 项 提供 长 期 镇 ， 只 对 一 种 称 为 读 谓 词 锁 的 类 卉 提供 短期 铁 。 事 
实 上 这 一 踢 离 级 别 解 决 了 到 目前 为 止 我 们 提 到 的 所 有 异常 问题 。 特 别 是 ， 它 解决 了 例 10.5.1 中 
出 现 的 在 一 个 事务 中 对 某 行 不 可 重复 的 异常 。 这 是 因为 读 事 务 对 数据 保留 长 期 的 读 锁 ， 因 此 
没有 任何 其 他 事务 能 够 更 新 该 数据 直到 读 事 务 提 交 为 止 。 因 此 将 这 一 隔离 级 别 命 名 为 
“Repeatable 及 ead”。 

真正 的 豆 串 行 性 是 由 图 10-9 第 四 行 的 并 离 级 别提 供 的 ， 它 提供 了 Repeatable Read 这 一 级 
别 所 能 提供 的 所 有 保证 并 且 使 读 谓 词 第 变 成 长 期 锁 ， 后 者 我 们 还 没有 讨论 ， 事 实证 明 ， 谓 词 
第 能 够 使 交错 执行 的 事务 避免 一 种 称 为 贿 灵 {或 者 称 为 央 灵 更 新 ) 的 异常 。 这 是 一 个 相当 精 
细 的 问题 ， 我 们 将 在 下 一 小 节 讨 论 这 个 问题 。 

4, 可 事 行 性 和 幽灵 更 新 

我 们 提供 一 个 在 Repeatable Read 隔 离 级 别 下 的 事务 操作 过 程 中 可 能 产生 的 异常 。 
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例 10.5.3 ”幽灵 更 新 异常 ”考虑 一 个 在 Repeatable Read 隧 离 级 别 下 的 事务 ， 访 事务 打开 了 
一 个 包括 银行 某 个 支行 的 accounts 表 中 一 组 行 的 游标 ， 提 取 后 续 行 并 对 它们 的 余额 进行 求 
和 , 然后 测试 该 总 额 是 否 和 表 branch_totals 中 具有 相同 的 branch_id 的 行 中 的 总 额 相 等 。 
如 梁 不 相等 ， 则 打印 钳 误 信息 。 这 个 任务 也 许可 以 用 以 下 的 逻辑 来 实现 ; 


exec 591 select sumtbalance) into :total from accounts 


where branch id = :bid: 
exetc S91 select balance into :bbal from brarch totals 


where branch id = :bid: 
1f thbal «<» total} 
{print out serious errory: 


XEE 5 COommit work: 


如 果 将 该 囊 务 逻辑 要 读 的 数据 或 者 其 他 并 发 事务 要 更 新 的 数据 都 加 上 长 期 锁 ， 看 上 去 我 
们 似乎 在 Repeatable Read 隐 离 绕 别 下 已 经 做 了 所 有 的 努力 然而， 一 种 不 同 的 异常 仍然 可 能 
发 生 .， 因为 朝 到 在 我 们 都 没有 考虑 如 于 这 种 操作 的 影响 : 插入 . :个 新 行 的 操作 和 在 老 行 上 
进行 更 新 的 操作 将 改变 第 一 条 Select 语 句 的 WHERE 子 名 返回 的 行 集合 的 成 员 。 必 须 注 意 到 这 
个 计算 一 组 行 的 总 和 的 Seiect 语 句 不 可 能 同时 访问 该 组 中 的 所 有 行 。 它 必须 一 边 走 一 边 判断 该 
组 中 到 底 有 哪些 行 ， 也 许 是 通过 索引 每 次 读 人 一 定 范 围 中 的 行 或 者 是 读 人 整 张 acceunts 表 
中 的 行 ， 然 后 逐 行 判断 是 理 是 符合 要 求 的 行 。 由 于 这 需要 花费 一 定 的 时 间 ， 因 此 当 事 务 进程 
让 入 一 串 信 息 并 对 它们 进行 确认 时 ， 可 能 同时 会 有 其 他 的 事务 播 入 --… 个 新 的 行 或 者 更 新 了 老 
的 行 便 得 符合 要 求 的 行 集 变 大 ,但 前 者 并 没有 注意 到 这 一 点 。 新 的 行 可 能 被 忽视 ， 因 为 该 行 
所 在 的 数据 页 面 也 许 已 经 被 人 负责 求 和 的 Select 语 刁 的 WHERE 子 名 检查 过 了 ,或 者 该 行 入 口 位 
置 所 在 的 范围 已 经 被 传递 给 WHERE 子 句 去 检查 了 。 这 时 就 会 导致 异常 ， 接 下 去 我 们 将 会 看 到 
这 一 点 。 

我 们 使 用 术语 L(A) 来 表示 事务 T 插 人 数据 项 A 的 操作 。 当 我 们 要 指定 捅 入 的 询 值 时 ， 我 们 
可 以 使 用 以 下 的 标记 : L(A，branch = SFBay,balance = 50)。( A 用 来 标记 竺 出 该 行 的 唯一 标识 
符 的 字段 值 ， 比 如 表 accounts 中 的 acct_id。) 现在 考虑 下 面 一 个 经 历 : 

Ri (谓词 :branch_ia -='SFBay') RCA1,100.00) Ri(A2,100.00}JR,(A3,100.00) {我 们 假定 这 
些 都 是 最 初 在 这 个 支行 中 找到 的 行 L(A4，branch=SEBay,balance = 100.00) ( 这 个 新 的 行 不 会 
被 Ti 注意 到 ) RbPpranch_ totals,bhranch_ ia ='SFBay', 300) W,(pranch. 
totals,branch idq = 'SFBay',400)C,( 现 在 事务 T, 已 经 修改 了 这 一 支行 的 
pranch_totals 行 ， 而 T, 还 没有 注意 到 这 一 点 )Ri(branch_totals,branch_id 
='SFBay ',400} (打印 出 错 信 息 ) Cn 

概括 地 说 ， 以 上 的 经 历 说 明了 这 样 一 件 事 : 事务 T 先 确定 表 acceunts 中 哪些 行 的 
branch_id 是 'SFBay'， 然 后 再 去 找 acct_id 值 分 别 为 A1、A2、A3 的 行 。 然 后 读 出 这 三 个 行 
的 余额 相 加 ， 得 到 的 值 为 $300.00， 在 这 时 ， 另 外 一 个 事务 T, 在 SFBay 支 行 创建 了 一 个 新 的 行 
A4 (这 时 显然 需要 重新 统计 ， 因 为 开始 只 有 三 行 )。T, 接 着 更 新 了 值 为 SFBay 的 
pranch_totals 从 而 反 虹 出 为 该 支行 增加 的 账号 金额 。 之 后 ， 事务 T, 读 到 了 这 个 被 T, 更 新 过 
的 值 ， 它 着 到 的 是 $400.00， 然 而 三 行 的 总 额 只 有 $300.00。 国 


期 间 没 有 任何 措施 来 阻止 T; 加 入 账 导 A,， 然 面 这 一 更 新 恰恰 违反 了 SFBay 支 行 的 余额 必须 
等 于 该 支行 所 有 账户 的 余额 值 总 和 这 个 一 第 性 规则 。 这 种 多 辑 并 没有 忽视 任何 行 上 的 镇 ,但 
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是 异常 仍然 发 生 了 。 原 因 就 是 这 个 新 行 A4 搬 入 表 中 时 ， 事务 T, 已 经 将 俏 词 pranch_iqd = 
' SmBay' 的 检测 完成 了 。 如 时 事务 T, 能 够 注意 到 行 A4， 当 然 会 在 行 A4 上 加 锁 ， 但 是 行 A4 加 入 
的 太 上 晚 了 。 

这 是 否 意味 着 前 面 所 说 的 串 行 性 理论 存在 问题 了 呢 ? 是 否 两 段 锁 协 议 2PL 并 非 包含 着 真正 
的 可 串 行 性 呢 ? 当然 不 是 ， 这 只 是 意味 着 我 们 没有 在 足够 的 对 象 上 加 锁 ， 我 们 没有 对 表 中 的 
某 些 行 加 锁 。 可 串 行 性 要 求 事务 访问 的 所 有 数据 对 象 都 出 现在 10.3.3 中 定义 的 前 趋 图 中 。 当 事 
务 读 到 谓词 branch_iq ='SFBay' 寺 ， 比 较 简单 的 谓词 锁 公 式 认为 可 以 在 相应 的 信和 是 上 如 
读 锁 ， 这 些 信息 由 包 揪 余额 值 的 符合 要 求 的 相应 行 组 成 ， 即 该 支行 的 一行 {ALA2.A3}。 当 事 
务 T, 向 该 支行 插 人 一 个 新 的 行 A4 时 ， 这 就 隐 含 地 在 该 谓词 上 加 了 写 锁 ， 因 为 当 计 算 谓词 时 这 
一 变动 将 支 变 可 用 的 信息 结果 行 集 )。 因 此 这 两 个 操作 在 这 个 谓词 上 上 是 一 对 冲突 操作 ; 因此 
当 有 长 期 读 谓 词 锁 存 在 时 ， 这 样 的 经 历 是 不 允许 的 。 扩 展 例 10.5.3 中 的 经 历 ， 使 其 包含 合适 的 
读 锁 和 写 锁 ， 我 们 可 以 得 到 如 下 的 经 历 : 

RL( 谓 词 branch_ id ='SFRay') Ri( 谓 词 branch_id = 'SFBay ')RL(A1.100.00) 
RA1,100.00)RLCA2,100.00) R{A2,100.00)RL (A3,100.00) RCA3,100.00)WL.(A4, branch 
-=' SFBav') { 淮 各 执行 插 人 L(A4, brarch_id='SFBay' ，balance=100.00)， 但 是 这 和 前 面 
的 该 谓词 上 的 RL 冲突 ， 因 此 T, 必 须 等 待 上 Ri(branch_totals,branch_ id = 'SFBay', 
300) (总 和 是 正确 的 ,没有 出 错 ) C,( 现在 所 有 的 镇 都 释放 了 j I,(A4, branch-= 
'SFBay',balance = 100.00)R,(branch _ totals,branch id ='SFBay' ,300) 
Wbranch totals,branch_id ='SFBay .400)0,, 

现在 这 个 经 历 是 完全 可 串 行 化 的 了 了。 如 图 10-9 所 示 ，SQL-99 标 准 中 可 Serializahie 这 个 隔离 
级 别 对 谓词 使 用 长 期 的 读 锁 和 写 锁 。 因 此 例 10.$.3 的 幽灵 更 新 问题 可 以 避免 了 ， 使 用 这 个 加 锁 
协议 的 经 历 是 完全 可 串 行 化 的 。 然 而 读者 不 应 把 在 谓词 上 加 锁 看 得 太 学 术 化 。 任 何 加 锁 类 型 只 
要 能 够 保证 当 一 个 事务 在 向 一 个 基于 某 个 谓词 锁 的 行 集合 添加 行 时 , 其 他 事务 不 能 访问 该 集合 ， 
就 能 去 除 幽 灵 更 新 间 题 。 一 些 数据 库 系 统 通过 加 锁 整 个 表 来 达到 这 个 目的 ， 这 些 不 必要 的 太 粗 
的 加 锁 粒 度 会 降低 并 发 性 ， 但 却 通 过 简单 的 系统 逻辑 保证 了 可 Serializable 隔 离 级 别 。 日 前 最 常 
用 的 谓词 锁 技 术 是 健 值 范围 的 加 锁 【key-range locking ), 该 内 容 的 细节 已 经 超出 了 本 书 的 范围 。 
关于 这 一 技术 的 介绍 ， 可 以 参考 本 章 末 尾 推荐 读物 中 Gray 和 Reuter 的 文章 [2]。 

我 们 将 提 一 下 SQL-99 的 另 一 条 规则 : 如 果 一 个 数据 库 系 统 希望 遵循 该 标准 ， 但 却 没 有 提 
供 基 一 个 隔离 级 别 ， 那么 它 必须 至 少 旬 供 Set Transaction 语 馈 中 的 安全 性 。 比 如， 如 杂 数 据 库 
系统 没有 Read Committed 这 一 隔离 级 别 ， 但 确实 含有 可 重复 读 ( Repeatable Read ) 的 特性 ， 
那么 当 以 下 的 请 名 执行 之 后 : 

exec sql set transaction isolation level read committed: 


系统 隐 含 地 就 有 了 可 Repeatable Read (重复 读 ) 这 一 级 别 。 


t0.6 事务 恢复 


我 们 前 面 已 经 提 到 过 ， 数 据 库 中 的 数据 是 存放 在 位 盘 上 的 ,磁盘 是 一 种 非 易 失 性 存储 媒 
介 。 此 处 的 非 易 失 性 可 以 通过 下 面 这 个 例子 来 说 明 : 当 系统 突然 断 电 时 ,磁盘 上 的 数据 不 会 
因此 而 丢失 。 相 比 之 下 ， 存 放 在 内 存 中 的 数据 一 旦 断 电 就 会 丢失 ， 因 此 通常 称 内 存 为 易 失 性 
的 存储 媒介 。 还 有 其 他 一 些 原因 也 会 导致 内 存 的 不 可 靠 性 ， 比 如 由 于 操作 系统 或 者 数据 库 系 
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统 本 身 的 不 完善 导 禾 系 统 册 省 。 许 多 系统 设计 大 员 认 为 这 样 的 错误 是 不 可 避免 的 ， 这 些 错 误 
导致 我 们 不 能 确信 和 内存 中 的 内 容 会 在 一 段 较 长 的 时 间 ( 比如 几 个 月 或 者 儿 年 ) 内 保持 稳定 。 
如 果 可 以 ,我 们 将 在 任何 时 候 将 数据 存放 到 磁盘 上 去 而 不 必 担 心 这 些 数据 会 丢失 。 

然而 ， 还 能 记得 我 们 在 9.2 节 中 讨论 的 ， 相 对 访问 内 存 而 言 访问 磁盘 的 速度 是 很 惕 的 。 我 
们 需要 将 磁盘 中 的 数据 页 面 访 到 内 存 缓冲 区 中 ， 以 便 为 计算 机 指令 提供 高 速 的 随机 访问 。 一 
日 -- 页 数据 读 人 内 在 缓冲 区 中 ,我 们 将 设法 保存 该 页 面 以 便 在 不 久 该 贞 面 中 的 数据 被 再 次 引 
用 ， 从 而 减少 系统 态 盘 IO 开销 。 为 了 支持 缓冲 机 制 我 们 使 用 了 一 种 称 为 后 备 缓 冲 的 方法 ， 该 
方法 允许 系统 收 到 一 个 伐 蔓 页 面 的 请 求 时 ， 先 去 试 着 散 列 到 后 备 表 中 该 页 面 的 项 。 如 果 在 后 
备 表 中 有 这 一 项 ， 说 明 对 应 的 太 盘 页 面 时 已 读 人 内 存 缓 冲 区 中 ; 否则 需要 从 位 盘 中 读 人 该 页 
面 。 自 然 ， 我 们 希望 保存 在 内 存 中 的 磁 扒 页 面 是 那些 最 为 常用 的 数据 页 向 ， 这 一 信息 可 以 使 
用 -- 种 称 为 LRU 缓 冲 策 略 获 得 (LRU 是 Least Recently Used 的 缩写 )。 该 策略 的 基本 想法 是 : 
读 到 内 存 中 的 数据 页 面 会 - - 直 保 留 在 内 存 中 ， 直 到 一 个 新 恋人 的 磁盘 页 和 面 需要 空间 并 且 所 有 
的 内 存 缓 冲 都 被 占 满 的 时 候 为 止 。 这 时 ， 必 须 释 放 某 些 缓冲 区 来 腾 出 - : 定 的 空间 ， 这 些 将 要 
释放 的 缓冲 区 是 那些 没有 被 经 常 使 用 的 页 面 一 一 最 近 最 少 使 用 的 页 面 。 

正如 我 们 希望 将 最 常用 的 数据 真 面 保留 在 内 存 中 从 面 可 以 被 不 同 的 事务 一 次 又 一 次 的 使 
有 用， 我们 同样 不 希望 每 次 数据 页 面 被 某 个 事务 更 新 之 后 都 要 做 写 问 磁盘 的 操作 。 如 果 这 是 经 
常 要 被 更 新 的 页 面 ， 比 如 银行 账户 行 ， 我 们 可 以 允许 成 百 上 于 次 的 更 新 而 不 做 写 回 操作 。 对 
于 和 辣 类 事务 应 用 价 言 这 是 最 重要 的 一 种 优化 。 在 此 重复 一 点 ， 我 们 不 看 望 一 旦 事务 对 某 些 页 
面 履 了 更 新 并 提交 之 后 就 写 回 这 些 数据 页 面 。 取 击 代 之 ， 我 们 通常 将 这 些 常 用 的 数据 页 面 保 
留 在 内 存 中 直到 它们 变 得 不 再 常用 从 而 成 为 LRU 的 数据 页 面 被 别 的 数据 页 面 震 控 出 缓冲 ( 注 
意 更 新 过 的 数据 页 面 在 它们 下 出 缓冲 之 前 必须 写 回 到 磁盘 上 )， 否 则 我 们 在 经 过 一 定 周 期 之 后 
强制 它们 写 回 磁盘 。( 我 们 会 在 稍 后 讨论 强制 写 回 磁 盘 丰 而 的 问题 )。 大 多 数 情况 下 ， 我 们 不 
会 这 人 么 做 ， 而 是 依靠 LRU 策 略 。 一 个 数据 页 面 被 称 为 是 胜 的 ， 如 果 从 上 一 次 写 回 磁 盘 之 后 被 
基 些 事务 做 了 更 新 操作 。 我 们 通常 会 将 胜 的 数据 页 面 保留 在 内 存 中 直到 更 新 该 数据 页 面 的 事 
务 提交 。! 我 们 会 在 习题 中 看 到 在 LRU 策 略 下 读 写 绥 冲 区 的 一 些 问题 。) 

但 现在 我 们 有 一 个 问题 。 假 定 我 们 突然 遇 到 断 电 或 者 系统 骨 焉 。 这 样 磁盘 上 的 茶 些 数 
据 页 面 将 得 不 到 更 新 ， 因 为 它们 被 频繁 使 用 以 敏 在 经 过 成 百 上 千 次 更 新 之 后 仍然 没有 被 写 
回 矿 盘 。 但 是 这 些 更 新 的 结果 都 存在 于 内 存 中 ， 这 样 看 上 去 所 有 的 更 新 都 将 竺 失 。 我 们 将 
如 人 和 何 处 理 这 个 问题 呢 ? 如 和 何 将 丢失 的 更 新 恢复 过 来 ， 而 不 使 用 前 面 提 到 过 的 每 次 更 新 之 后 
都 进行 写 回 的 方式 ? 

问题 的 答案 是 对 每 个 更 新 操作 系统 给 自己 做 一 个 记录 ， 称 为 日 志 项 ， 该 记录 避 存 在 一 个 
称 为 忆 志 缓冲 区 的 内 存 区 域 中 。 日 志 项 包含 相应 更 新 操作 的 足够 信息 ， 使 得 系统 能 够 知道 如 
何 来 重 做 该 更 新 操作 或 者 在 事务 异常 中 目的 情况 下 撤销 该 更 新 操作 。 在 合适 的 时 刻 日 志 缓 冲 
区 将 被 写 央 到 磁盘 上 一 个 称 为 日 志文 件 的 顺序 文件 中 ， 该 文件 包括 了 在 过 去 的 某 个 时 间 锋 中 
所 有 的 日 志 项 。 通 过 这 种 方式 ， 在 某 一 时 刻 一 旦 内 存 中 的 内 容 丢 失 ， 恢 复 进程 就 能 够 通过 日 
志文 件 对 伙 盘 的 相应 数据 进行 更 新 操作 。 这 个 日 志方 法 比 每 次 更 新 操作 都 写 回 的 方式 要 好 的 
其 中 一 个 原因 是 : 系统 只 需要 以 一 个 不 太 频 繁 的 间隔 写 回 日 志 缓 冲 区 就 行 了 了， 而 该 操作 可 以 
和 其 他 大 量 数据 页 面 更 新 操作 一 起 进行 ， 从 而 节省 了 IO 开销 。 

我 们 将 在 稍 后 看 到 系统 需要 这 些 日 志 记录 来 完成 恢复 操作 。 即 使 所 有 磁盘 页 面 的 更 新 操 
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作 都 写 回 到 磁盘 ( 只 要 这 些 操 作 不 怎么 占 系 统 资源 ) 对 于 恢复 操作 而 言 也 不 是 充分 的 。 如 果 
一 个 事务 进行 过 程 中 发 生 系 统 前 泪 ， 就 会 给 数据 库 留 下 不 一 致 的 状态 【比如 由 于 评 偿 更 新 梨 
作 疫 有 执行 ， 从 而 使 得 钱 多 出 来 或 者 消失 了 )， 因 为 我 们 竺 失 了 内 存 中 的 内 容 ， 我 们 同样 也 丢 
失 了 当时 程序 逻辑 所 处 的 位 置 ， 而 这 一 信息 是 我 们 在 执行 补偿 更 新 操作 时 所 需要 的 。 我 们 不 
仅 要 恢复 对 磁盘 上 每 一 页 的 更 新 ， 同 样 要 人 恢复 骨 演 之 前 所 有 提交 的 事务 的 一 致 状态 ， 这 一 点 
很 重要 。 为 了 充分 实现 这 一 目标 ， 日 志文 件 必 不 可 缺少 的 。 

以 上 对 数据 库 恢 复 的 简单 介绍 覆盖 了 本 竟 前 面 提 到 的 事务 ACID 性 质 中 的 持久 性 的 大 部 分 
内 容 。( 男 外 一 个 关于 钼 理 存 储 在 磁盘 这 样 的 稳定 介质 上 的 数据 的 丢失 问题 将 在 10.9 节 做 简单 
介绍 。) 我 们 现在 可 以 进行 关于 日 志文 件 的 讨论 了 ,通常 数据库 用 它 来 人 处 理 内 存 数据 玉 失 问题 ， 
我 们 将 看 到 系统 是 如 何在 系统 崩 演 之 后 利用 这 个 文件 进行 恢复 操作 的 。 


10.7 恢复 细 市 : 日 志 格 式 
考虑 下 面 调度 器 将 看 到 的 经 历 H5 的 操作 : 


[10.7.4] HS = Rita, SOF WtA, 20) RatC, 100) WytC, S50) C2 RitB, $50) WitB, 80}) C1 ... 


由 于 我 们 前 面 介绍 过 的 LRU 缓 冲模 式 的 原因 ， 我 们 知道 数据 项 A 、B 和 K& 的 更 新 后 的 值 不 
一 定 会 按 它们 在 经 历 中 发 生 的 顺序 写 回 到 磁盘 上 去 。 如 果 在 将 来 基 个 时 刻 发 牛 系统 崩 演 ， 我 
们 也 许 会 在 磁盘 上 看 到 这 样 的 值 : A = 50 (由 于 A 在 一 个 常用 的 数据 页 面 上 ， 因 此 更 新 
WA,20) 没 有 被 写 回 到 磁盘 上 )，C = 100 ( 数据 C 的 更 新 还 没有 写 回 到 磁盘 上 )，B = 80 (B 的 
更 新 已 经 写 回 到 磁盘 上 了 )。 我们 必须 很 清楚 地 部 道 LRU 组 冲 横 式 是 以 减少 磁盘 [DO 次 数 为 目 
标 来 进行 的 ， 因 此 我 们 不 能 期 望 磁盘 能 和 LRU 缓 冲 保 持 一 致 的 结果 。 事 务 T 从 银行 账户 中 提 
出 了 50 美 刻 ， 虽然 事务 T, 提 奖 了 但 这 一 结果 却 没 有 被 写 回 到 磁盘 上 ， 假定 用 户 已 经 将 钱 拿 走 
了 。 同 时 客户 从 账户 A 向 账户 B 转 账 30 美 元 的 变易 中 却 意外 地 获得 了 30 美 元 。( 银 行 是 不 会 嘉 
欢 这 种 行为 的 。) 

然而 ， 就 像 我 们 在 前 面 提 到 过 的 那样 ， 即 使 系统 在 每 个 更 新 操作 后 都 将 结 灯 写 回 到 位 盐 
上 也 不 能 解决 问题 。( 即使 系统 在 事务 提交 时 执行 所 有 写 回 操作 也 不 能 解决 问题 ) 假定 我 们 
实行 这 样 的 策略 : 一 旦 缓冲 区 的 数据 页 面 被 更 新 ， 该 页 就 立刻 写 辐 到 伐 盘 上 去 ; 假定 经 历 H5 
中 C, 之 后 系统 发 生前 祺 。 这 样 串 务工 的 第 二 个 更 新 就 不 能 写 回 刘 磁盘 上 去 了 。 当 系统 崩 泪 重 
新 启动 之 后 ， 我 们 会 在 磁盘 上 发 现 这 样 的 值 : A = 20 ,C = 50, B = 50。A 和 B 的 总 和 应 该 是 100， 
因为 T, 并 不 希望 增加 或 减少 这 两 个 账户 的 余额 总 和 。 在 事务 提交 时 执行 所 有 的 写 加 操作 仍然 
会 发 生 同 样 的 问题 : 当 系 统 在 写 回 两 个 数据 页 面 的 中 间 央 演 时 导致 的 问题 就 和 上 面 的 例子 -… 
样 了 ， 因 此 这 两 个 方法 都 不 能 解决 问题 。 

问题 的 难点 在 于 我 们 要 保证 在 本 章 开 始 时 提 到 的 事务 性 质 中 的 两 条 性 质 : 原子 性 和 持久 
性 。 回 想 一 下 原子 性 的 定义 ， 它 是 组 成 事务 的 一 系列 数据 项 更 新 是 -个 不 可 分 的 ， 这 些 操作 
要 人 么 全 做 要 人 么 全 不 做 。 这 一 性 质 即使 在 系统 册 滇 后 仍 将 得 到 保 证 ， 这 号 水 太 到 事务 的 持久 性 。 
事务 的 持久 性 要 求 一 旦 事务 提交 之 后 ， 事 务 对 数据 库 所 做 的 更 新 就 应 该 保存 下 来 ， 即 使 系统 
质 省 之 后 也 能 将 该 事务 所 做 的 更 新 居 复 过 来 。 我 们 前面 已 经 提 到 过 ， 当 系统 使 用 日 志文 件 时 
就 能 保证 这 一 性 质 。 一 个 称 为 数据 库 恢 复 的 过 程 将 在 系统 崩 演 后 执行 ， 它 使 用 衣 江 之 前 记 式 
的 日 志 项 将 数据 库 所 在 磁盘 恢复 到 系统 在 出 沉 这 一 刻 应 该 有 的 一 致 状态 ,保证 一 个 举 务 的 氛 
作 要 么 全 做 要 么 全 不 做 。 
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必须 注意 我 们 在 前 一 节 中 提 到 的 关于 数据 库 恢 复 的 一 个 重要 假设 是 ; 在 系统 斋 省 重启 之 
后 ， 事 和 荔 系 统 水 远 都 不 可 能 记得 在 内 存 数据 二 失 时 止 在 运行 的 事务 逻辑 的 意图 。 这 样 的 兽 述 
最 得 太 过 星 深 而 崔 于 掌握 尽管 当前 正在 努力 改变 这 一 点 )。 当 前 ， 所 有 的 数据 库 人 恢复 过 程 都 
依赖 于 稳定 存储 器 上 的 信息 将 数据 库 恢 复 到 一 个 一 致 状态 。 那 么 系统 崩溃 时 一 致 状态 是 怎么 
样 的 呢 ? 比如 经 历 H5 中 C 之 后 发 生前 泪 。 这 个 状态 应 该 是 这 样 的 : 因为 事务 T: 执 行 了 提交 操 
作 ， 我 们 应 该 能 够 恢复 该 事务 所 产生 的 最 终结 果 ; 而 事务 T, 没 有 能 够 执行 其 中 的 一 个 更 新 操 
作 ， 妆 然 也 没有 提交 ， 因 址 它 在 前 面 所 做 的 任何 更 新 产生 的 影响 部 应 该 消除 .因此 我 们 得 到 
的 结果 应 该 是 : A = 50 ,C = 50, B = 50。 这 是 一 个 一 致 状态 。 

我 们 现在 来 重 瑟 经 历 H5， 刘 网 10-13 所 示 。 在 一 些 操作 旁边 列 出 了 存放 在 内 存 缓冲 区 中 的 
恢复 时 使 用 的 该 操作 对 应 的 日 志 项 。! 我 们 强调 这 些 日 志 项 是 放 在 内 存 中 的 ， 将 日 志 缓 冲 区 的 
内 容 写 回 到 磁盘 上 的 日 志文 件 这 一 操作 在 图 10-13 中 作为 一 个 特殊 的 事件 .。) 要 提醒 读者 的 是 ， 
在 此 处 所 陈述 的 细节 并 不 是 基于 某 个 特定 的 商业 数据 库 系 统 的 。 我 们 使 用 了 简化 的 易于 说 昌 
恢复 机 制 的 方式 ， 从 而 能 方便 地 掌握 大 多 数 数 据 库 中 恢复 过 程 的 实质 精神 。 相 比 而 言 ， 商 业 
数据 库 中 的 实际 的 数据 库 焦 复 体 系 结构 要 复杂 得 多 . 


操作 U 志 项 说 明 
RA, 30) tS, 11 事 笋 T 的 日 志 项 开始 ， 读 操作 无 须 艇 日 志 ， 但 该 操作 标志 


普 事 务 的 升 始 

A 工 为 Ahanlance 的 更 新 写 中 志 。50 是 更 新 之 前 的 值 ，20 总 
央 新 之 后 的 性 

RaltC, 100) 5,2) 事务 了 前 日 专项 开始 

Wt $1 WwW, 了 C, 100, 50) 写 的 日 志 项 

C2 (ts 2} 提交 事 竹 工 , 日 志 项 (将 日 志 缓 冲 区 写 癌 日 志 立 件 ) 

RiB, $0} 没有 日 志 项 

WlB, $0) (Ww, 1, B, SO, 80} 

CI (©, 1) 事务 Ti 提交 (将 日 志 垦 冲 区 写 四 日 志文 件 ) 





图 10-13 经 历 H5 的 操作 以 及 相关 的 日 志 项 


我 们 来 看 -下 图 10-13 中 的 第 二 个 操作 Wi(A,20)， 这 是 事务 T, 执 行 的 一 个 更 新 操作 ， 将 表 
accounts 中 acct_id = 的 行 的 余额 列 记 为 20。 问 样 ， 图 10-13 中 与 入 的 日 志 项 (W.1.A,50,20)， 
其 中 50 是 数据 项 A 在 更 新 之 前 的 值 ，20 是 数据 项 A 在 更 新 之 后 的 值 。 在 更 为 复杂 的 有 明志 项 下 ， 也 
许 还 会 用 到 唯一 的 行 标识 (比如 ROWID )， 还 有 多 列 更 新 前 各 更 新 后 的 值 。 在 此 图 中 出 现 的 所 
有 日 志 项 的 类 型 都 是 针对 单行 的 。 对 十 插入 和 删除 操作 而 言 同 样 也 存在 日 志 项 ， 为 了 简化 我 们 
的 讨论 我 们 在 此 将 忽略 它们 。 在 图 10-13 中 我 们 可 以 看 到 两 个 事件 将 日 志 组 冲 区 瑟 回 到 磁盘 上 的 
日 志文 件 中 ， 在 我 们 的 简单 模式 中 ， 只 有 在 两 种 情况 下 我 们 才 会 将 日 志 缓 冲 写 回 到 日 志文 件 中 : 
( 1 ) 当 一 些 捉 务 提交 时 ; (2 ) 当日 志 缓 冲 区 已 满 而 没有 多 余 的 空间 容纳 重 多 的 日 志 项 时 - (两 
此 为 了 不 影响 其 他 的 工作 ， 我 们 希望 系统 有 “磁盘 写 的 双 组 冲 机 制 "， 这 意味 着 系统 可 以 回 第 二 
个 日 志 缓 冲 区 写 日 志 项 ， 而 同时 将 第 - -个 已 经 满 了 的 日 志 缓 证 区 写 回 到 磁盘 上 去 。) 

现在 我 们 将 证 明日 志 项 中 已 经 包含 了 足够 的 数据 ， 可 以 让 系统 在 骨 潢 之 后 恢复 到 一 个 一 
致 状态 。 我 们 可 以 着 到 我 们 会 碰 到 两 种 不 同 的 问题 。 首 先 ， 我 们 已 经 将 一 些 没 有 完成 的 事务 
所 敌 的 更 新 写 回 到 伐 盘 上 去 后。 我 们 将 撤销 这 些 更 新 对 磁盘 造成 的 影响 【我 们 称 之 为 UNDD 小 
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由 于 这 个 原因 我 们 在 日 志 项 中 记录 了 更 新 前 的 值 。 其 次 ， 我 们 会 发 现 一 些 已 经 提 区 了 的 事务 
没有 将 它们 更 新 过 的 数据 写 回 到 磁 冀 上 。 我 们 将 重新 执行 这 些 操作 ， 将 新 的 值 写 回 到 磁盘 上 
[我 们 称 之 为 REDO 操 作 }， 出 于 这 个 原因 我 们 在 日 志 中 记录 了 更 新 后 的 值 ， 

现在 假定 在 图 10-13 的 操作 序列 中 W,(B,80) 完 成 之 后 系统 骨 演 这 意味 着 日 志 项 
(W,1,B,50,80) 已 经 写 到 自 志 缓冲 区 中 , 但 是 号 到 磁盘 上 的 最 后 的 日 志 项 是 (C,2)， 这 是 我 们 在 
恢复 过 程 中 能 够 找到 的 最 后 的 日 志 项 。 这 时 ， 事 务 T.: 已 经 提交 而 T, 述 没有 提交 ， 我 们 必须 确信 
事务 T 所 做 的 更 新 全 部 存 到 了 磁盘 廿 而 事务 T 在 磁盘 上 做 的 更 新 都 被 撤销 。 如 同 在 图 10-13 前 
面 所 解释 的 那样 ， 恢 复 之 后 最 后 得 到 的 结果 应 该 是 : A = 50 ,C= 50, B = 50。 

在 系统 骨 演 重 司 之 后 系统 操作 员 给 出 启动 恢复 的 命令 ,( 这 通常 是 一 条 RESTART 命 令 ， 
我 们 通常 称 恢复 过 程 为 RESTART。) 恢复 过 程 林 以 分 为 ROLLBACK 和 ROLL FORWARD 两 个 
阶段 。 在 ROLLBACK 阶 段 ， 日 志文 件 中 的 日 志 项 从 后 向 前 扫描 ， 直 到 日 志 交 伴 头 (所 有 数据 
存 取 操作 的 开始 位 置 )。{ 我 们 假定 此 处 系统 是 从 经 历 H5 的 R,(A,50) 拱 作 开 始 的 )。 在 ROLL 
FORWARD 阶 段 ， 日 志文 件 是 从 前 向 后 扫描 的 。 在 ROLLBACK 阶 段 ， 恢 复 操作 执行 UNDO 操 
作 撤 销 那些 不 应 该 发 生 的 更 新 ， 因 为 执行 这 些 更 新 的 事务 没有 提 深 ， 与 此 同时 生成 一 张 提交 
事务 的 列表 。 在 ROLL FORWARD 阶段， 恢复 程序 执行 REDO 操 作 完 成 那些 应 该 发 生 的 更 新 ， 
国 为 这 些 更 新 是 出 提交 事务 发 出 的 。 为 了 便于 说 明 我 们 只 是 给 出 了 一 个 简单 的 恢复 过 程 的 体 
系 结 梅 ， 其 中 我 们 假定 ROLLBACK 棵 作 先 做 ， 然 后 进行 ROLL FORWARD 操 作 。 这 是 IBM 的 
System R( DB2 的 前 身 ) 系统 使 用 的 顺序 ， 但 是 你 必须 知道 的 是 许多 现代 的 数据 库 系 统 执行 
的 是 相反 的 项 序 。 但 这 对 我 们 说 明 性 的 介绍 并 不 是 太 重 要 。 

图 10-14 和 图 10-15 列 出 了 在 恢复 的 两 个 阶段 中 遇 到 的 所 有 日 志 项 以 太 恢 复 过 程 所 采取 的 相 
应 行动 。 注 意 每 一 行 的 左边 列 的 数字 是 恢复 过 程 中 的 步骤 。 


日 志 项 执行 ROLLBACK 操 作 
I. (C, 2) 事务 T 放 和 拱 交 列表 
2. (W, 2, C, 100, 50) 因为 T, 在 提交 列表 中 ， 所 以 不 伐 件 何事 
3. (5, 2) 标记 T, 不 再 是 活动 的 了 


4.(W, 1, A, 30, 20) 王 没 有 提交 ， 因 此 系统 对 该 数据 项 执行 UNDO 操 作 ， 将 A 的 值 
设 成 修改 之 前 的 5 。 将 T, 放 入 未 提交 事务 列表 


3. 145, 1) 标记 IT 不 再 是 活动 的 了 





图 10-14 经 历 H5 的 ROLLBACK 过 程 ( 系统 在 W.(B,80) 后 朋 湾 ) 


. 日志 项 执行 ROLLFORWARD 操 必 
6. {5, 1) 无 须 任 何 操作 
7. ( 殉 1; A 50,20) 工 是 未 提交 事务 ， 所 以 不 做 任何 事 
8. (3, 2) 无 须 任 何 操作 


2.7 2, CC, 100, 30) TT; 在 提交 列表 中 ， 因 此 系统 对 该 数据 项 执行 UNDO 操 作 ， 将 C 
的 值 设 成 峰 改 之 后 的 50 


10, (C, 2) 无 须 任 何 操 作 
11. 标记 整个 日 志文 件 的 ROLL FORWARD 操作 完成 


恢复 过 程 结 审 
图 10-15 ROLL FORWARD 过 程 + 在 图 10-14 的 ROLLBACK 择 作 之 请 ) 
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我 们 需要 对 图 10-14 和 图 10-15 中 所 采取 的 各 个 步 又 进行 一 下 说 明 。 在 ROLLBACK 阶 段 系 
统 从 后 向 前 扫描 日 志文 件 产生 提交 事务 和 未 提交 事务 的 列表 。 实 现 这 一 点 是 比较 简单 的 ， 因 
为 记录 在 日 志文 件 中 的 任何 事务 的 最 后 一 个 操作 要 么 是 提交 操作 要 么 是 其 他 操作 t 说 明 该 事 
务 还 没有 提交 )， 系 统 道 向 扫描 日 志文 件 时 首先 遇 到 每 个 事务 最 后 发 出 的 操作 。 提 交 事 务 列表 
将 在 恢复 过 程 的 下 一 个 阶段 ROLL FORWARD 中 使 用 ， 而 未 提交 事务 列表 将 在 这 个 阶段 用 来 
确定 和 何 时 进行 UNDO 操 作 。 因 为 当道 向 扫 摘 日 志 时 【总 是 先 遇 到 每 个 事务 最 后 发 出 的 操作 )， 
系统 很 容易 判断 一 个 事务 是 否 是 未 提交 事务 。 对 未 提交 事务 的 写 操作 日 志 项 可 以 立即 进行 
UNDO 操 作 。 当 然 在 恢复 过 程 中 UNDO 或 者 REDO 操 作 需 要 相应 的 磁盘 缓冲 区 。 我 们 可 以 在 图 
10-14 中 的 步骤 4 中 看 到 对 一 个 写 操 作 执 行 UNDO 操 作 的 例子 。 由 于 发 出 写 操 作 的 事务 没有 提 
交 ， 因 此 该 写 操 作 不 应 该 反映 到 磁盘 上 。 可 能 这 些 写 操作 的 结果 当时 的 确 没 有 写 到 磁盘 上 ， 
但 是 可 以 肯定 的 是 将 操作 对 象 的 值 恢复 到 写 操作 之 前 的 肯定 是 无 害 的 一 一 因为 我 们 最 终 将 该 
数据 项 恢复 到 了 未 提交 事务 试图 对 它 进行 更 新 之 前 的 状态 。 在 ROLLBACK 过 程 中 对 记录 事务 
开始 的 日 志 项 的 关注 并 不 是 必要 的 ， 因 为 我 们 能 够 保证 当 我 们 到 达 日 志文 件 的 开始 处 时 《 系 
统 启动 的 时 刻 )， 没 有 任何 事务 处 于 活动 状态 。 在 更 为 普遍 的 情况 下 ，ROLLBACK 要 求知 道 
哪些 事务 仍然 处 于 活动 事务 列表 中 以 决定 何 时 结束 。 

在 图 10-5 的 ROLL FORWARD 示 例 中 ， 系 统 简 单 地 使 用 了 在 ROLLBACK 过 程 收集 的 提交 
事务 别 表 ， 对 这 些 提 交 事 务 执 行 REDO 操 作 。( 参见 步 又 9 的 REDO 操 作 的 例子 。) 

在 恢复 操作 结束 之 后 ， 我 们 在 磁盘 上 应 该 看 到 的 是 正确 的 值 。 所 有 提交 事务 发 出 的 更 新 
都 反映 到 了 磁盘 上 ， 而 所 有 未 提交 事务 发 出 的 更 新 都 被 回 滚 。 的 确 是 这 样 ， 我 们 可 以 广 意 到 
在 ROLLBACK 的 步骤 4 中 我 们 将 50 写 人 数据 A 中 ， 在 ROLL FORWARD 的 步骤 9 中 我 们 将 50 写 
人 数据 B 中 。 我 们 应 该 记得 崩溃 是 在 经 历 H5 的 W.(B,80) 之 后 发 生 的 。 因 为 该 操作 的 日 志 项 设 
有 被 记录 到 磁盘 上 《 在 图 10-13 中 我 们 可 以 看 到 这 一 点 )， 因 此 在 恢复 过 程 中 我 们 无 法 将 找到 B 
原来 的 值 。 但 我 们 需要 依赖 这 样 一 个 事实 ， 即 对 B 的 更 新 并 没有 真正 写 到 磁盘 土 。 基 本 上 我 们 
可 以 肯定 这 样 一 个 事实 ， 如 果 一 个 未 提交 事务 的 发 出 的 写 操 作 的 值 写 到 了 磁盘 上 ， 那 么 忆 姑 
该 操作 的 日 志 项 也 必然 写 到 了 磁盘 上 。 我 们 将 在 下 一 节 中 来 讨论 这 个 问题 。 假 定 我 们 可 以 相 
信 这 样 一 个 事实 ， 即 B 的 新 值 80 并 没有 写 到 磁盘 上 上 ， 那 么 经 历 H5 中 涉及 的 二 个 值 : A=50， 
B=50 (初始 值 )，C=50 (恢复 过 程 将 写 人 的 正确 值 )。 

保证 需要 的 日 志 项 都 在 磁盘 上 

我 们 如 何 能 够 保证 正确 的 恢复 过 程 所 需要 的 日 志 项 都 在 磁盘 上 呢 ? 首先 ， 很 重要 的 一 操 
是 操作 系统 能 够 保证 写 到 融 盘 的 操作 能 够 正确 地 完成 ， 这 是 和 事务 提供 的 ACID 性 质 是 对 应 
的 。 委 回 到 磁盘 的 操作 是 原子 操作 ， 这 意味 着 即使 是 在 写 磁盘 的 过 程 中 系统 崩溃 ， 那么 当下 
次 读 到 写 过 的 这 块 数据 时 ， 也 能 立即 判断 出 写 操作 是 否 成 功 执行 了 ; 如 果 成 功 执行 了， 那么 
可 以 认为 该 数据 块 是 符合 数据 库 的 正确 逻辑 的 。 当 执行 写 磁盘 的 操作 时 ，LIHO 子 系统 通常 会 
通过 写 完 后 再 读 一 次 来 测试 结果 磁盘 映像 ， 如 果 有 错 则 再 次 执行 写 操 作 。 如 果 在 经 过 多 次 重 
试 之 后 仍然 不 能 成 功 写 人 ， 则 操作 系统 会 得 到 一 个 严重 的 错误 警告 。 因 此 如 果 发 生 写 错误 ， 
那么 写 操作 成 功 之 后 的 正常 的 逻辑 就 不 能 继续 。 比 如 ， 当 事务 提交 触发 号 癌 日 志 缓 冲 区 时 ， 
旭 果 发 生 写 错误 那么 提交 操作 将 失败 。 如 果 在 写 读 操作 过 程 中 系统 骨 溃 ， 那 么 将 产生 错误 的 
块 ，RESTART 之 后 对 该 数据 块 的 读 操 作 将 检测 到 这 种 错误 的 存在 。 因 此 我 们 能 够 保证 没有 
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不 可 检测 的 铺 误 存在 ; 敏感 的 “错误 检测 编 妈 ”数据 存放 方式 将 支持 这 一 保证 ,“ 先 写 后 读 ” 
的 磁盘 写 操 作协 议 内 置 于 磁盘 头 中 。 所 有 的 这 些 错误 检测 在 IOD 子 系统 的 一 个 非常 底层 的 级 
别 上 进行 ， 其 至 对 操作 系统 是 透明 的 。 

没有 不 可 检测 的 磁盘 写 错误 在 系统 月 省 时 也 是 可 保证 的 。 当 系统 得 到 写 操 作成 功 完 成 的 
通知 时 ,就 保证 了 将 来 对 该 数据 块 的 于 操作 会 取得 成 功 ( 除非 整个 磁盘 丢失 ， 像 10.9 节 中 说 
明 的 那样 )。 因此 当 数 据 库 系统 将 日 志 缓冲 区 写 回 到 磁盘 上 的 日 志文 件 后 〈 出 于 严格 的 恢复 考 
虑 ， 有 时 这 样 的 写 回 操作 是 同时 对 系统 中 的 两 个 磁盘 进行 的 ， 这 样 可 以 获得 更 高 的 可 靠 性 )， 
我 们 可 以 安全 地 认为 触发 这 次 写 回 操作 的 事务 提交 获得 了 成 功 。 

更 在 假定 我 们 可 以 相信 日 志文 件 写 问 操 作 ， 那 么 我 们 仍然 需要 确保 恢复 的 于 辑 是 正确 的 ， 
也 就 是 说 我 们 始终 能 从 口 志文 件 中 找到 执行 正确 的 恢复 操作 所 需要 的 日 志 项 。 已 经 知道 我 们 
可 以 将 恢复 工作 分 成 两 种 类 型 : UNDO 和 REDO。 先 来 考虑 对 提交 事务 发 出 的 更 新 操作 执行 的 
REDO 操 作 。 我 们 知道 事务 的 提交 操作 是 触发 日 志 组 冲 区 写 回 种 盘 的 原因 ， 在 将 日 志 组 冲 区 与 
回 到 磁盘 之 前 该 事务 不 能 被 认为 是 成 功 完成 的 。( 比如 ， 该 事务 是 一 个 银行 皮球 的 任 笋 ， 在 日 
志 缓 冲 区 记录 到 磁盘 之 前 我 们 不 能 将 钱 支 出 去 。) 因为 提交 操作 的 日 志 项 必须 写 回 到 磁盘 上 去 ， 
因此 在 这 之 前 的 该 事务 的 写 如 作 的 日 志 项 都 被 写 回 到 了 磁盘 上 ( 我们 必须 注意 到 日 志 项 在 日 
志 缓 冲 区 中 是 按 序 放置 的 , 因此 关于 提交 操作 前 日 志 项 必然 在 该 事务 所 有 其 他 日 志 项 前 后 面 )， 
所 以 我 们 能 金保 证 REDO 任 务 能 够 正确 地 执行 。 

恢复 过 程 的 第 二 个 任务 是 对 日 志文 件 中 所 有 的 未 提交 事务 更 新 执行 UNDO 操 作 。 我 们 未 
得 到 和 任何 保证 ， 未 提交 事务 已 经 发 出 的 更 新 操作 的 日 志 项 都 写 回 到 了 磁盘 上 。 比 如 ， 图 10- 
13 到 图 10-15 中 的 恢复 例子 中 日 志 缓 剖 区 的 最 后 写 操作 日 志 项 是 (W.1,B8.50.80)， 但 和 骨 泪 发 生 
时 该 日 志 项 并 设 有 写 回 到 磁盘 上 【我 们 没有 执行 与 国 日 志 缓 冲 区 的 操作 ， 直 到 (C,1) 记 人 
日 志 缓冲 区 )。 我 们 应 该 自问 这 样 的 结果 是 理会 导致 什么 问题 。 对 于 这 些 没 有 与 回 到 磁盘 上 
的 日 志 项 ， 相 关 的 UNDO 操 作 是 否 就 可 以 不 做 了 呢 ? 很 明显 仅 当 更 新 过 的 数据 页 面 由 于 LRU 
的 缓冲 机 制 被 写 回 到 磁盘 上 时 ， 才 有 可 能 使 更 新 过 的 数据 在 日 志 缓 冲 区 写 回 之 前 写 到 磁盘 上 。 
( 站 果 该 数据 页 面 没 有 被 替换 出 去 . 那么 ONDO 操 作 在 恢复 过 程 中 将 是 不 必要 的 ， 就 像 我 们 
在 前 面 看 到 的 关于 数据 项 B 的 情况 一 样 。) 看 上 去 数据 页 面 似乎 会 在 相应 的 日 志 项 之 前 写 回 到 
磁盘 上 去 ， 比 如 ， 在 一 个 写 操作 之 后 进行 了 了 大量 的 读 人 新 的 数据 页 面 的 操作 ， 其 间 没 有 任何 
提交 操作 来 触发 写 回 日 志 缓冲 区 。 这 些 读 操 作 最 终 将 迫使 缓冲 机 制 重新 使 用 已 被 更 新 的 行 所 
在 的 数据 页 面 。 

这 是 一 个 非常 合理 的 例子 ， 因 此 我 们 必须 提供 一 些 特殊 的 措施 来 保证 这 种 现象 不 会 发 生 。 
其 中 一 种 可 能 的 措施 是 在 一 定 程度 上 修改 LRU 页 面 蔡 换 策 略 ， 使 得 更 新 过 的 数据 也 不 会 被 移 
到 磁盘 直到 相应 的 事务 提交 。 这 样 的 缓冲 策 畴 事实 上 已 经 被 提出 过 了 ， 所 有 被 某 个 事务 重新 
过 的 数据 页 面 都 将 保留 在 缓冲 区 中 直到 该 事务 提 和 区 为 止 。 在 这 种 策略 下 ， 事 实 上 在 恢复 过 程 
中 根本 不 需要 UNDO 操 作 ， 因 此 也 无 需 在 日 志文 件 中 记录 它们 原来 的 值 。 然 而 当 一 个 事务 对 
大 量 的 数据 页 面 进 行 更 新 时 ， 我 们 就 不 能 保证 保留 所 有 这 些 缓 冲 区 直到 该 事务 提交 为 止 (我 
们 可 能 会 耗费 所 有 的 内 存 )。 一 个 更 为 复杂 的 策略 是 允许 事务 在 提交 之 前 申明 它 对 某 个 缓冲 区 
页 面 的 使 用 已 经 完毕 ， 无 逢 在 内 存 中 保留 该 缓冲 区 页 面 。 比 如 ， 当 对 某 个 游标 的 某 个 数据 页 
面 执行 了 FETCH 指 令 后 ， 我们 可 以 说 该 事务 已 经 完成 了 对 该 数据 页 面 的 使 用 ， 该 数据 页 面 已 
经 无 须 保 留 在 内 存 中 了 。( 当然 ， 在 Serializable 隔 离 级 别 下 的 事务 必须 保持 它 在 每 个 计 写 过 的 
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行 上 的 馈 ， 无 论 该 行 所 在 的 数据 页 面 起 否 在 竣 存 中 。) 

因此 我 们 又 回 到 了 前 面 提 划 过 的 情况 : 一 个 更 新 过 的 数据 页 面 由 于 LRU 替 换 策 略 有 可 能 
在 由 应 的 日 志 缓 冲 区 写 回 磁盘 之 前 写 回 到 磁盘 上 上， 这样 在 恢复 过 程 的 UNDO 操 作 中 就 会 出 现 
问题 。 为 了 防止 这 种 情况 ， 系 统 必须 保证 相关 的 自 志 必 须 在 相应 的 脏 (修改 过 的 ) 数据 页 面 
之 前 写 回 到 磁盘 上 去 。 通 常 称 之 为 先 写 日 志 原 则 (WAL)Y。 实 现 这 一 原则 ， 数 据 库 系 统 通 常 创 
建 称 为 日 志 序 列 下 (LSM) 的 一 个 日 志 项 属性 ， 该 序列 号 戎 善 写 到 日 志 缓 冲 区 中 日 志 项 的 增加 而 
增长 。 我 们 距 踪 最 近 一 次 日 志 缓 冲 区 被 写 回 到 磁盘 后 被 建立 的 日 志 组 冲 区 中 的 最 小 序列 号 ， 
记 为 LSN_BUFFMIN 。 (这 对 数据 库 系统 而 言 是 一 个 全 局 值 ， 如 果 我 们 假定 我 们 只 有 -- 个 系统 
缓冲 区 。) 此 外 对 于 每 个 数据 缓冲 页 面 ， 我 们 记录 该 页 最 近 一 次 更 新 操作 的 日 志 序 列 号 ， 记 为 
LSN_PGMAX。 最 后 我 们 定义 这 样 . -个 原则 ， 即 一 个 磁 盐 页 面 不 能 被 LRU 缓 冲 区 写 旬 磁盘 ， 
除非 该 缓冲 页 面 的 LSN_PGMAKX 比 全 局 的 LSN_BUFFMIN 小 。 这 就 保证 了 在 有 关 的 日 志 项 写 
回 到 磁盘 了 上 之前， 相关 的 数据 缓冲 页 面 不 会 被 写 回 到 磁盘 上 去 ， 从 而 解决 了 UNDO 过 程 中 可 
能 遇 到 的 问题 。 根 据 上 面 的 陈述 我 们 可 以 有 下 和 面 的 定理 ， 在 此 我 们 不 提供 证 明 。 


定理 10.7.1 简单 恢复 ”给 定 这 些 晶 志文 件 与 到 磁盘 的 保证 ,恢复 过 程 能 够 为 任何 事务 经 
历 在 任何 时 记 的 般 溃 提供 有 效 的 铸 复 。 衣 省 之 前 提交 的 事务 所 做 的 所 有 更 新 将 切实 地 反映 到 
磁盘 上 ， 而 未 提交 事务 所 做 的 那 部 分 更 新 操作 将 被 回 滚 。 国 


10.8 检查 点 


在 10.7 节 所 提供 的 恢复 例子 中 ， 我 们 执行 ROLLBACK 过 程 直到 系统 启动 的 那 一 刻 。 这 是 
- -个 明显 的 选择 ， 国 为 那 时 数据 库 处 于 完全 一 致 的 状态 ， 系 统 缓冲 区 中 不 存在 有 驻 的 缓冲 页 面 ， 
事实 上 所 有 的 事务 数据 更 新 操作 还 没有 开始 。 我 们 可 以 将 ROLLBACK 操 作 认 为 是 将 数据 库 恢 
复 到 这 样 一 个 质朴 状态 的 过 程 { 只 有 提交 事务 发 出 的 更 新 操作 将 记录 到 太 盘 上 )，ROLL 
FORWARD 操 作 的 尾 务 是 从 那 一 刻 起 重 做 在 崩 省 之 前 提交 事务 发 出 的 所 有 更 新 操作 。 

但 是 恢复 过 程 所 和 需 划 的 时 间 和 ROLLBACK 和 ROLL FORWARD 过 程 中 要 读 取 的 日 志 交 件 
的 长 度 成 正比 。 在 每 一 阶段 我 们 都 必须 从 磁盘 上 读 取 目标 行进 行 更 新 ， 最 坏 情 况 下 这 样 的 过 
程 需要 的 时 间 也 许 和 当时 应 用 程序 执行 的 时 间 一 样 长 。 如 果 我 们 假定 大 多 数 事 务 的 周期 都 是 
相对 较 短 的 ( 几 秘 钟 )， 那么 ROLLBACK 阶 段 将 变 得 快捷 而 有 效 。 因 为 它 只 要 对 骨 淄 时 仍然 
处 于 活动 状态 的 事务 已 经 发 出 的 更 新 操作 进行 UNDO 操 作 即 可 。 然 面 ROLL FORWARD 操 作 却 
和 日 志文 件 的 长 度 有 很 太 的 关系 ， 因 为 该 过 程 必须 REDO 所 有 提交 事务 发 出 的 更 新 操作 《假定 
大 多 数 事 务 已 经 提交 )。 因 此 执行 ROLL FORWARD 操 作 的 时 间 甚 至 会 比 原始 应 用 执行 这 些 更 
新 操作 所 花费 的 时 间 还 要 和 多。 我 们 希望 做 的 是 记录 系统 情 动 之 后 经 过 -一 段 合理 的 时 了 间 之 后 的 
一 个 一 致 状态 ， 这 样 恢复 过 程 就 不 需要 从 日 志文 件 最 初 的 位 置 开 始 执行 ROUL FORWARD 操 
作 ， 而 只 需要 从 记录 的 这 一 点 《我 们 通常 称 之 为 检查 点 ) 开始 执行 该 操作 即 可 。 当 然 ， 我 们 
希望 在 这 种 方式 下 恢复 操作 能 达到 预期 的 目的 ， 即 能 够 忽略 所 有 在 检查 点 之 前 发 生 的 事务 和 
数据 更 新 操作 。 

有 三 种 创建 数据 库 的 恢复 检查 点 的 不 同方 法 。 根 据 三 种 方法 的 复杂 性 排序 ， 它 们 分 别 是 : 
提交 一 致 性 检查 点 ， 高 速 镍 站 一 致 性 检查 点 ， 模 糊 一 致 性 检查 点 。 使 用 较 复 杂 的 检查 点 方法 ， 
系统 能 够 维护 一 个 平稳 的 事务 输出 ， 因 此 作为 用 户 而 言 当 然 希望 有 更 鸭 复 煲 的 检查 点 策略 ， 
如 果 系 统 设计 者 能 够 实现 这 些 策略 的 话 。 没 有 任何 系统 需要 同时 支持 两 种 不 问 的 方法 。 我 们 
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先 来 潮 述 在 普通 事务 系统 中 采用 的 较为 简单 的 检查 点 策略 一 一 提交 一 到 性 检查 点 。 

1. 提交 一 发 性 检查 点 

首先 ， 系 统 抉 定 开始 记录 一 个 检查 点 【也 许 由 于 上 次 作 检 查 点 后 日 志 记录 项 的 数量 已 经 
超出 了 一 定 的 服 制 ) 时 ， 系 统 进入 “执行 检查 点 状态 ”。 

定义 10.8.1 提交 一 致 性 检查 点 的 过 程 步 弛 在 进 和 人 执行 梯 查 点 状态 之 后 ， 我 们 会 有 了 以 于 
一 些 规 则 ， 

1) 新 的 事务 不 能 开始 直到 检查 点 完成 。 

2) 现 有 的 事务 继续 执行 直到 提交 并 且 相 : 关 的 日 志 都 写 到 磁盘 上 。 

3) 当前 的 日 志 组 冲 区 都 号 加 到 日 志文 件 中 ， 这 样 系统 就 能 保证 缓冲 中 所 和 有 的 胜 数据 页 面 


都 写 回 到 了 磁盘 上 。 
4) 步骤 1 ~ 3 完成 之 后 ， 系 统 写 人 一 个 特殊 的 日 志文 件 项 (CKPT ) 到 磁 夫 上， 检查 点 的 操 
作 完 成 。 | 


定义 10.8.1 中 的 步 豫 1 - 3 同样 定义 了 我 们 在 关闭 系统 时 所 要 做 的 精确 步 双 ， 这 样 我 们 在 下 
次 启动 时 就 不 需要 进行 恢复 了 。 最 终 的 状态 等 价 于 系统 启动 时 日 志文 件 中 还 没有 日 志 项 的 状 
态 。 结 果 很 显然 我 们 可 以 修改 前 一 节 中 提 到 的 恢复 过 程 ， 这 样 回 滚 操作 只 需 执行 到 遇 到 该 形 
式 的 日 志 项 (CKPT) 即 可 ， 而 不 是 整个 日 志文 件 。 我 们 可 以 保证 没有 一 个 事务 在 检查 点 这 一 刻 
仍 处 于 运行 状态 ， 前 面 所 有 的 事务 都 已 经 提交 并 且 它 们 的 更 新 都 口 经 写 到 磁盘 上 ， 这 样 这 些 
操作 的 日 志 项 在 日 志文 件 中 就 显得 不 再 那么 重要 。 通 过 执行 检查 点 ， 我 们 可 以 大 大 减少 进行 
焦 复 操作 所 需要 的 时 间 。 

2. 其 他 检查 点 类 型 的 动机 

像 我 们 提 到 的 那样 ， 定 义 10.8.1 中 定义 的 检查 点 的 过 程 和 系统 关闭 时 所 进行 的 操作 顺序 是 
相同 的 。 没 有 新 的 事务 可 以 开始 直到 系统 中 所 有 的 活动 事务 结束 并 且 所 有 的 及 数据 页 面 都 已 
经 写 回 到 磁盘 上 。 这 一 过 程 也 许 需 要 较 长 的 时 间 。 在 此 ， 我 们 认为 事务 的 周期 是 非常 短 的 ， 
它们 也 许 在 几 秒 内 就 能 结束 。 但 是 这 一 假设 并 非 在 所 有 的 计算 机 上 都 是 成 立 的 。 在 大 多 数 数 
据 库 系 统 中 事务 很 有 能 会 持续 几 分 钟 甚 至 几 小 时 ， 在 这 过 程 中 都 会 有 读 和 写 的 操作 。 然 而 这 
样 长 的 操作 在 提交 一 致 性 检查 点 时 几乎 是 不 可 能 的 ， 除 非 我 们 愿意 在 这 段 时 间 内 关闭 系统 。 
( 就 像 我 们 在 步骤 1 中 提 到 的 那样 ， 检 查 点 过 程 中 处 理 新 的 事务 不 能 开始 . ) 对 于 写 回 缓冲 区 的 
操作 ， 可 以 考虑 如 果 我 们 有 200MB 的 内 存 空间 用 作 磁 盘 缓 部 区 ( 每 页 4KB )， 其 中 一 半 的 数据 
页 面 是 胜 的 ， 因 此 必须 被 瑟 思 到 磁 批 上。 于 是 我 们 将 有 100MU4K=25 000 个 页 面 需要 写 回 磁盘 。 
因为 当 使 用 单个 磁盘 上 ， 每 写 回 一 个 页 面 大 约 需 要 1140 秒 ， 总 共 的 时 间 将 是 25 000/40=625 秒 。 
随和 着 内 存 价格 的 下 降 ， 这 样 的 情况 将 变 得 很 普通 。 

为 了 避免 这 类 问题 在 检查 点 过 程 险 塞 系统 操作 ， 需 要 采用 更 为 复杂 的 检查 点 策略 。 我 们 
在 定义 10.8.1 中 提 到 的 检查 点 类 型 称 为 提交 一 致 性 检查 点 ， 因 为 所 有 的 事物 都 必须 提交 ， 并 且 
和 及 数据 页 面 都 窟 回 到 磁盘 上 。 于 一 个 级 别 的 检查 点 策略 称 为 高 速 缓存 一 致 性 检查 点 。 使 用 该 
策略 ， 人 允许 事务 的 活动 周期 跨 检 查 点 ， 我 们 只 需要 保证 缓冲 区 中 所 有 的 胜 数 据 页 面 都 写 回 到 
磁盘 上 包括 相关 的 日 志 项 )。 内 存 中 的 磁盘 缓冲 区 通常 下 以 称 为 磁盘 高 速 缓存 ， 这 也 解释 了 
这 一 检查 点 策略 的 名 称 。 然 而 在 做 快 存 一 致 性 检查 点 的 过 程 中 ,仍然 处 于 活动 状态 的 事务 必 
须 处 十 等 待 状态 ; 特别 我 们 不 能 发 出 新 的 MO 把 作 。 但 是 ， 这 仍然 要 比 提交 一 致 性 检查 点 的 要 
求 要 宽松 一 些 ， 后 者 在 有 较 长 事务 存在 的 情况 下 会 耗费 大 量 的 时 间 。 我 们 在 下 一 步 将 列 出 做 
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快 存 一 致 性 的 检查 点 所 需要 的 步骤 。 此 处 我 们 简单 的 提 -- 下 ， 仍 然 存 在 更 为 复杂 的 检查 点 策 
略 ， 印 模糊 检查 点 ， 这 类 检查 点 策略 允 省 在 胜 数 据 页 不 瑟 辐 磁盘 的 情况 下 作 检 查 点 。〈 这 类 检 
查 点 被 认为 是 不 完全 的 ,和 除非 所 有 的 缓冲 页 写 回 到 磁盘 ; 但 是 它 区 许 有 些 重要 的 工作 在 这 过 
程 中 继续 进行 。) 

3,. 高 速 组 存 一 致 性 检查 点 

以 下 是 系统 在 做 高 速 租 存 一 致 性 检查 点 时 需要 的 过 程 。 

定义 10.8.2 ”高速 缓存 一 致 性 检查 点 的 过 程 步 骤 

1) 新 的 事务 不 能 开始 。 

2) 存在 的 事务 不 允许 发 出 新 的 操作 。 

3} 当前 的 日 志 缓 冲 区 写 回 到 磁盘 上 ， 之 后 系统 保证 高 速 缓存 中 的 所 有 脏 数 据 页 面 都 号 回 
到 硫 盘 上 。 

4) 最 后 将 一 个 特殊 的 上 日志 项 (CKPT，List) 写 人 磁盘 ， 到 此 我 们 完成 了 检查 点 。List 中 保存 
的 是 检查 点 过 程 中 仍然 处 于 话 动 状 态 的 事务 的 列表 。 | 

使 用 高 速 缓 存 一 致 性 检查 点 的 恢复 过 程 和 使 用 提 变 一 致 性 检查 点 的 恢复 过 程 在 方法 上 有 
着 很 大 的 不 同 。 

例 10.8.1 ”使 用 高 速 缓存 一 致 性 检查 点 的 日 志文 件 和 恢复 这 里 是 :个 新 的 经 历 用 来 说 明 
高 速 缓 存 一 致 性 检查 点 的 特性 。 我 们 会 列 出 日 志 缓 冲 区 中 的 日 志 项 以 及 该 经 历 中 崩 省 之 后 进 
行 的 恢复 过 程 。 首 先 该 经 历 如 下 : 

RtA, OF WitA, 1) C1 RatA, 1 RatB, 2} WotA, 3) R4C, 5) CKPT WalB, 4) Ca 

RaB, 4 WatC, 6) Cy, CRASH 

这 是 该 经 历 的 日 志 项 事件 序列 。 操 作 C, 在 崩 泪 之 前 没有 完成 ， 因 此 写 回 到 磁盘 上 的 最 后 
一 个 日 志 项 是 (C,3)。 

(S, DW 1, A, 10, 4} (C, 1 15, 2) (3, 3) OW 2 A, 1, 3) 15, {CKPT, 

(LIST = Tz,TyT4)) (WwW. 3, B, 2, 中 人， 3 OW, 4, C, 5. 6} 

在 我 们 荐 高 速 缓存 一 致 性 检查 点 时 ， 我 们 将 以 下 一 些 值 写 回 到 磁盘 上 去 : A=3,B=2,C=5。 
[ 外 舍 数 据 A 的 胜 数 据 页 面 在 作 检 查 点 时 当 回 到 矿 盘 上 。) 我 们 假定 没有 其 他 的 更 新 操作 在 崩溃 
之 前 写 回 到 磁盘 上 ， 因 此 磁盘 上 数据 项 的 值 保 持 不 变 。 在 下 面 的 图 中 说 明了 各 种 事 伯 的 发 生 
过 程 。 事 务 T, 以 日 志 项 (S,ky 开 始 ， 以 (C,kj) 结 束 。 
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现在 我 们 列 出 在 恢复 过 程 中 采取 的 动作 ， 以 ROLLBACK 操 作 开 始 : 


ROLLBACK 

1.(C,3) 注意 事务 T, 蚌 活动 事务 列表 中 已 提 交 事 务 。 

2. (W,3,B,2,4) 已 提交 事务 ， 等 待 ROLL FORWARD。 

3. {CKPT,(LIST=T,, T,, T,))) 注意 事务 T 、T, 是 活动 事务 列表 中 已 提交 事务 ， 
4.(S.4) 活动 事务 列表 现在 变 为 {T,}。 

5. (W,2,A,1,3) 未 提交 事务 。，UNDO: A=1。 

6.(9,3) 已 提交 事务 。 

7.(S.2) 活动 事务 列表 为 空 ， 结 束 ROLLBACK. 


我 们 可 以 看 到 在 使 用 高 速 缓存 - 致 性 检查 点 的 情况 下 ， 当 ROLLBACK 磁 到 CKPT 日 志 项 
时 ， 系 统 记 下 活动 事务 列表 ， 尽 管 我 们 还 没有 看 到 日 志文 件 中 的 任何 操作 。 根 据 活动 事务 列 
表 ， 和 删除 已 经 提交 的 事务 ， 则 列表 中 剩 下 的 事务 发 出 的 操作 需要 进行 UNDO 。 我 们 继续 
ROLLBACK 阶 段 ， 让 到 完成 所 有 的 UNDO 操 作 。 我 们 可 以 确定 何 时 结束 UNDO， 因 为 当 碰 到 
{S,k) 焉 志 项 时 ， 就 将 该 事务 从 未 提交 事务 列表 中 去 除 。 当 所 有 这 样 的 T, 被 去 除 之 后 ， 
ROLLBACK 就 可 以 结束 了 ， 尽 管 日 志文 件 中 仍然 还 有 别 的 日 志 项 . 

ROLL FORWARD 

8. (CKPT(LIST=T:. T, TJ) 忽略 在 这 之 前 的 日 志 项 。 已 提交 事务 ={T,}。 


DTW SB 4) 及 LT FORWARD.: B=4. 
10.(C,3) 设 动作 。 最 后 一 个 日 志 项 ， 于 是 ROLL FORWARD 结 
束 。 


在 ROLL FORWAR 的 开始 阶段 ， 我 们 只 需 REDO 已 提交 事务 发 出 的 那些 可 能 没有 写 辐 到 磁 
盘 上 的 更 新 操作 即 可 。 我 们 可 以 距 到 检查 点 之 后 的 第 一 个 操作 ， 因 为 我 们 知道 检查 点 之 前 的 
所 有 更 新 操作 都 已 经 写 回 到 磁盘 上 去 了 ROLL FORWARD 继 续 到 缓冲 区 文件 的 末尾 。 在 系统 
骨 洛 时 磁盘 上 的 值 为 : A=3,B=?,C=5。 恢 复 过 程 结 束 之 后 ,我们 有 A=1 (步骤 5) 和 B=4( 步 
骤 9 ), 万 的 值 仍然 是 5。 根 据 前 面 的 时 序 图 (事实 上 (C,4) 日 志 项 从 来 没有 被 写 过 )， 我 们 可 以 
看 到 我 们 希望 事务 T, 和 事务 T, 以 及 T, 的 更 新 操作 写 回 到 磁 埠 上 。 没 有 一 个 T, 完 成 的 更 新 操作 瑟 
回 到 磁盘 上 。 因 此 我 们 得 到 恢复 需要 的 结果 是 : A=1,B=4,C=5。 国 


4. 模糊 检查 点 

模糊 检查 点 的 目标 是 减少 完成 检查 点 的 绝对 时 间 。 高 速 缓 存 一 致 性 检查 点 只 需要 将 所 有 
的 脏 的 缓冲 页 面 写 回 到 蔽 盘 上 即 可 ， 相 对 于 提交 一 致 性 检查 点 而 言 是 一 个 提 上 站 ， 后 者 要 求 所 
有 的 活动 事务 提交 。 然 而 写 回 40MB 的 缓冲 数据 对 于 一 个 每 秒 钟 只 能 进行 80 次 邱 操 作 的 三 盘 而 
言 仍然 需要 花费 几 分 钟 的 时 间 。 习 惯 于 事务 操作 在 几 稍 之 内 司 出 反应 的 用 户 对 于 这 样 的 等 待 
将 是 非常 敏感 的 .在 这 过 程 中 没有 任何 事务 的 动作 可 以 得 到 栅 行 。 

为 了 去 除 这 一 限制 ， 模 糊 检 查 点 恢复 策略 使 用 两 个 检查 点 事件 ， 即 最 近 在 日 志文 件 中 记 
录 的 两 个 用 CKPT 标 记 的 检查 点 。 这 个 策略 的 方法 是 系统 每 次 做 检查 点 CKPT\ 时 ， 记 录 自 从 上 
次 做 检查 点 CKPT、 以 来 缓冲 区 中 的 胜 的 数据 页 面 集合 。 这 样 做 的 用 途 时 ， 这 些 脏 的 数据 页 面 
将 在 下 次 做 检查 点 CKPT,., 时 写 回 到 磁盘 上 。 在 两 个 检查 点 之 间 的 这 段 时 间 中 这 些 脏 的 数据 页 
面 有 很 好 的 机 会 由 正常 的 缓冲 区 管理 操作 写 回 到 磁盘 上 。 当 下 一 次 做 检查 点 的 事件 临近 时 ， 
可 以 启用 后 台 进程 来 写 回 频繁 更 新 的 脏 的 数据 页 而 ， 这样 在 下 次 做 检查 点 时 我 们 可 以 做 到 以 
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下 保证 : 在 做 检查 点 CKPT\ ,时 记录 的 所 有 脏 的 数据 页 面 在 做 检查 点 CKPT, 之 后 都 已 经 写 回 到 
了 磁 盟 上 .这 样 可 以 使 得 我 们 在 做 检查 点 CKPT, 时 避免 写 回 缓 冲 区 的 操作 。 我 们 只 需要 对 前 
而 讨 到 的 商 速 缓存 一 致 性 检查 点 下 使 用 的 恢复 过 程 稍 加 改动 ， 从 最 后 的 倒数 第 二 个 检查 点 
CKPT,,( 如 捍 CKPT,\ 是 最 后 一 个 检查 点 ) 处 开始 执行 ROLL FORWARD 操 作 ， 


定义 10.8.3 模糊 检查 点 的 过 程 步骤 

1) 芷 做 按 查 点 之 前 ， 前 一 个 输 查 点 遗留 的 胜 的 数据 页 面 将 写 回 到 磁盘 上 ( 同时 应 该 留 出 
… 定 的 OQ 带宽 支持 并 发 事务 的 正常 操作 的 需要 ; 因为 这 种 写 回 操作 并 不 显得 的 太 迫 切 )。 

2) 在 做 检查 点 的 开始 阶段 ， 没 有 新 的 事务 可 以 开始 。 存 在 的 事务 不 能 发 出 新 的 操作 。 

3) 当前 的 日 志 缓 冲 区 写 回 到 磁盘 上 ， 并 潜 加 一 个 日 志 项 【CKPT\,，List )， 这 和 高 速 缓存 
-- 歼 性 检查 点 中 所 做 的 一 样 。 

4) 标记 从 上 次 检查 点 CKPT', 到 现在 这 中 时 间 里 变 脏 的 数据 缓冲 区 页 面 。 这 一 过 程 也 许可 
以 通过 在 缓冲 区 日 录 中 做 标记 来 实现 。 这 些 信息 不 需要 保留 刘 磁 鼻 上 ， 因 为 这 些 信 息 上 只 是 在 
F 次 做 检查 点 时 俩 放 ， 而 不 是 谋 恢复 时 使 用 。 | 

就 像 上 血 解 释 的 那样 ， 使 用 模糊 检查 点 的 恢复 过 程 和 使 用 高 速 缓存 --- 致 性 检查 点 的 恢复 
过 程 不 同 之 处 只 在 于 ROLL FORWARD 必 须 从 日 志文 件 的 倒数 第 一 个 检查 点 后 的 第 一 个 日 志 
项 开始 ,参见 后 面 的 寺 题 。 


10.9 介质 恢复 


到 有 目前 为 止 我 们 只 是 假设 内 存 中 的 数据 会 由 于 掉 电 或 者 系统 册 省 而 丢失 ， 但 是 写 到 做 盐 
王 的 数据 是 可 靠 的 ， 即 假定 前 省 之 后 磁 益 上 的 数据 始终 是 可 用 的 。 但 这 并 不 总 是 如 此 ， 一 个 
磁盘 上 的 数据 也 有 可 能 全 部 于 失 ， 比 如 读 写 数据 的 磁头 损坏 就 会 导致 这 种 问题 ， 就 像 老 式 留 
声 机 的 碟 片 被 磁 针 损坏 一 样 。 但 这 样 的 事件 发 生 时 ， 就 震 要 特殊 的 恢复 措施 ， 我 们 称 之 为 介 
质 恢 复 。 我 们 应 该 将 此 考虑 到 我 们 的 通用 恢复 策略 中 。 在 这 一 节 中 ， 我 们 将 指出 解决 这 类 问 
题 的 方法 。 

对 于 不 包含 介质 故障 的 系统 崩 泪 而 言 ， 我 们 可 以 采取 10.7 和 10.8 节 中 的 依 复 策略 ， 这 些 措 
施 中 我 们 总 是 假设 磁盘 上 的 数据 是 正确 的 。 如 果 ~- 个 磁 扒 在 事务 棵 作 过 程 中 损坏 ， 那 么 系统 
将 前 福 ， 并 坦 醒 操作 员 磁 盘 已 经 损坏 。 这 时 必须 进行 介质 恢复 。 简 单 的 介质 恢复 过 程 是 这 样 
的 : 在 系统 启动 之 前 ， 事 务 系 统 要 用 到 的 磁盘 都 将 做 成 批 的 拷贝 。 这 些 拷 贝 来 自 宛 余 的 磁 盟 
或 者 廉价 的 往 带 介质 ， 我 们 称 这 些 数 据 为 在 线 矿 盘 的 备份 。 当 一 个 磁盘 在 系统 崩溃 中 损坏 之 
后 ， 我 们 就 用 备份 的 磁盘 来 替换 ( 这 时 需要 新 的 备份 以 防 新 问题 的 出 现 )， 然 后 进行 正常 的 恢 
复 过 程 。 然 而 在 这 类 恢复 过 程 中 ， 我们 需要 将 ROLLBACK 执 行 到 系统 开始 时 刻 为 止 ， 因 为 我 
们 不 能 保证 做 检查 点 时 写 回 磁盘 (已 损坏 ) 的 数据 在 备份 磁盘 上 也 得 到 了 点 新 。 接 着 我 们 从 
系统 前 省 的 那 一 刻 起 执行 ROLL FORWARD 操 作 。 我 们 可 以 假设 新 的 磁 圾 就 是 系统 骨 滥 时 的 
那个 磁 航 ， 只 是 该 硫 盘 上 的 数据 自从 系统 启动 后 一 直 都 没有 更 新 过 。 和 根据 这 样 的 理解 ， 很 明 
显 正常 的 恢复 过 程 可 以 帮助 我 们 恢复 在 该 备份 磁盘 上 的 所 有 更 新 操作 。 

稳定 的 存储 介质 

现在 我 们 已 经 意识 到 了 磁盘 介质 也 有 可 能 损坏 ， 由 此 可 能 产生 下 面 的 问题 ， 如 果 磁 盘 上 
的 上 日志 文件 也 损坏 了 怎么 办 ? 和 仁 案 是 我 们 需要 预见 到 这 - -点 ， 并 通过 同时 入 两 个 不 同 的 设备 
( 通常 是 磁带 ) 上 写 日 志文 件 解决 这 一 问题 。 这 种 技术 通常 称 为 日 志 镜 像 。 我们 的 目的 是 通过 
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保证 两 个 镜像 设备 独立 存放 日 志 来 达到 更 高 的 可 靠 性 。 我 们 努力 确保 某 一 偶然 事件 可 能 导致 
其 中 一 个 设备 上 数据 的 丢失 ， 但 是 却 不 影响 男 一 个 设备 的 数据 。 比 如 ， 两 个 设备 是 用 不 同 的 
供电 系统 (或者 至 少 一 个 设备 有 备份 电源 )， 它 们 是 分 开 存放 的 ， 因 此 物理 上 的 震动 不 会 间 时 
影响 两 个 设备 。 存 赃 的 数据 在 两 个 设备 上 是 重复 的 (无论 是 否 用 来 存放 日 志 数 据 )， 这 样 的 存 
馈 方 案 相 对 于 磁盘 上 单 拷贝 的 非 易 失 性 存储 和 内 存 这 样 的 易 类 性 存储 而 言 称 为 稳定 的 存储 。 


10.10 性 能 : TPC-A 基 准 测试 


我 们 来 回顾 一 下 到 目前 为 止 和 第 10 章 讨论 的 内 容 相 关 的 性 能 问题 .10.2 节 的 内 容 告 诉 我 
们 高 级 并 发 操作 可 以 通过 将 不 同事 务 的 操作 重重 执行 使 得 多 个 设备 同时 工作 。 央 此 我 们 能 够 
通过 事务 的 并 发 来 提高 CPU 的 利用 率 和 事务 的 吞吐 量 。 在 10.5 节 我 们 阐述 了 为 什么 当 有 较 多 
的 事务 进 人 等 待 状 态 时 ， 较 高 的 事务 可 串 行 化 要 求 会 降低 系统 的 并 发 性 并 进一步 损害 系统 的 
杏 吐 量 。 由 此 我 们 引出 了 SQL-99 标 准 中 的 电离 级 别 的 概念 。 在 10.6 节 中 我 们 开始 讨论 内 存 中 
的 磁盘 缓冲 区 页 面 引发 的 数据 持久 性 问题 ， 当然 人 性 能 问题 是 作为 磁盘 缓冲 从 而 降低 YC 开 销 和 和 
节省 磁盘 辟 资 源 需求 的 最 终 动机 。 

然而 ， 与 此 同时 我 们 避 开 了 对 许多 复杂 的 实现 机 制 的 讨论 ， 而 这 些 问题 对 事务 的 性 能 有 
着 重要 的 影响 。 事 务 系统 为 了 保证 事务 的 ACID 人 性 质 需要 大 量 的 CPU 开 销 和 ILO 资源 ， 就 这 一 
点 而 言 拿 事 务 系统 和 简单 的 磁盘 访问 文件 系统 相 比 是 毫 无 意义 的 ， 因 为 后 者 不 提供 这 些 保 证 。 
为 了 对 事务 运行 的 开销 有 一 个 感性 的 认识 ， 考 虑 下 面 一 个 事务 执行 的 例子 。 

假定 一 个 事务 以 一 个 SQL 调用 开始 ， 通 过 索引 访问 一 行 。 一 串 IO 请 求 将 被 提交 给 事务 管理 
器 (参见 图 10-8 )。 事 务 管理 器 给 该 线程 建立 一 个 事务 编号 ， 然 后 将 调用 传递 给 调度 器 ,， 调 度 器 
必须 对 索引 查找 的 谓词 进行 加 锁 ， 包 插 检 查 该 谓词 是 否 和 已 有 的 镇 冲突 。 对 于 任何 的 VO 调用 都 
必须 在 进行 实际 的 磁盘 访问 之 前 质 行 这 一 检查 过 程 。 在 磁盘 页 面 和 存 取 的 行 上 同 榜 需要 使 用 短 
期 锁 和 长 期 锁 。 如 果 请 求 的 锁 发 生 冲 突 ， 有 时 会 进行 一 些 测试 确 定 是 否 发 生 了 死 锁 。 如 果 没 有 
死 锁 发 生 ， 调 度 器 将 把 调用 线程 设置 为 等 待 状态 ， 系 统 将 通过 进程 交换 将 别 的 进程 调 人 执行 。 
当 检 测 到 死 镇 发 生 时 ， 必 须 选 出 和 慑 牲 事 务 异 常 中 止 执行 ， 并 将 牺 性 事务 所 做 的 所 有 更 新 操作 回 
滚 。 当 然 在 正常 的 事务 执行 过 程 中 每 次 更 新 操作 都 会 记录 日 志 ， 在 日 志 项 中 记录 了 该 操作 的 目 
标 数 据 更 新 前 和 更 新 后 的 值 ， 日 志 项 存放 在 日 志 绥 冲 区 中 。 当 事务 提交 的 的 时 候 (我 们 考虑 简 
单 的 系统 )， 日 志 缓冲 区 的 内 容 将 被 写 回 到 磁盘 上 的 日 志文 件 中 【 两 份 斤 贝 存放 在 两 个 稳定 的 具 
有 独立 失效 模型 的 设备 上 )。 

我 们 可 以 看 到 为 了 保证 事务 的 ACID 性 质 ， 为 了 完成 这 项 工作 需要 做 大 量 的 设计 选择 。 历 
史上 上 事务 系统 中 的 许多 性 能 瓶颈 是 由 最 初 的 设计 特性 造成 的 。 随 着 时 间 的 推移 ， 高 级 事务 系 
统 的 实现 在 关于 如 何 提高 性 能 方面 将 变 得 更 加 复杂 。 人 们 开发 了 大 量 的 事务 基准 来 使 用 户 对 
不 同 供应 商 提供 的 事务 系统 进行 比较 。 这 些 基 准 测 试 中 最 著名 的 一 个 称 为 TPC-A 基 准 测试 。 
这 一 基准 测试 是 由 事务 处 理性 能 委员 会 (TPC ) 定义 并 标准 化 的 ，TFC 是 由 工业 界 专门 经 营 事 
务 型 数据 库 软 件 和 硬件 的 供应 商 组 成 的 一 个 委员 会 。 标 准 制 定语， 没 过 几 年 大 多 数 供应 商 不 
会 将 一 个 没有 TPC-A (或 者 较 简单 的 TPC-B ) 测试 结果 的 事务 型 数据 库 产品 推 向 市 场 ， 因 为 
用 户 需 要 这 方面 的 信息 。 现 在 TCP-A 莽 准 测 试 已 经 不 再 是 供应 商 采 用 的 一 个 正式 的 基准 。 尽 
管 如 此 ， 在 关于 事务 系统 的 性 能 瓶颈 问题 FTCP-A 基 准 测 斌 仍然 能 够 给 我 们 一 些 好 的 思路 。 
大 多 数 供 应 商 内 部 仍然 使 用 该 基准 测试 来 跟踪 一 些 可 能 的 性 能 问题 。 下 面 将 给 出 该 基准 测试 
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的 一 个 简单 描述 。 

之 所 以 将 该 基准 测试 定义 得 如 此 详尽 的 原因 是 能 够 保证 使 用 该 基准 测试 的 所 有 供应 商 能 够 得 
到 相同 的 测试 ， 上 规则 上 不 存在 松散 性 使 得 只 有 某 个 供应 商 适 应 该 规则 ， 从 而 得 到 不 公平 的 事务 吞 
上 时 其 . 

], TPC-AA 基 准 说 明 

TPC-A 基 准 模仿 银行 业 的 应 用 ， 要 求 定 交 四 张 表 ， 如 图 10-16 所 示 。( 注意 ， 用 于 测试 的 事 
务 系 统 并 非 一 年 要 是 关系 型 的 ， 并 且 我 们 也 可 以 用 包含 同样 记录 数 的 文件 米 代 替 上 共有 给 证 数量 
行 的 表 。 然 而 ACID 性 质 是 必须 的 ， 所 以 我 们 不 能 在 一 个 简单 的 文件 系统 上 进行 这 个 基准 测试 。 ) 








表 时 1 数 行 大 小 主键 
Acerunt O0000.00n TO 人 bytes Bccounrt TY 
Teller 1000 TO bytes Teller_ID 
Branch ED 100 bytes Branch_ID 
Hstory Waries SO byres lhreount_ID, Time_sramp} 












图 10-16 TPC-A 基 准 测 试 和 再 要 的 表 ( Rating 志 100TPS ) 


在 图 10-16 的 前 三 张 表 (Account,Teller,Branch ) 中 定 交 了 该 表 的 行 数 ， 该 行 数 是 
基于 基准 测试 程序 的 事务 吞吐 量 不 超过 100TPS 的 假设 。 这 些 表 所 需要 的 行 数 和 TPS( 比 率 ) 成 线 
性 关系 。 比 如 ， 存 200TP5 的 事务 吞 叶 率 下 ，Account 表 需要 两 干 万 行 ，Tel1ler 表 需要 两 千 
行 ，Branch 表 需要 两 百 行 。 对 于 事务 大 吐 量 较 小 的 测试 也 可 以 使 用 较 太 的 数据 量 , 但 是 调试 
员 可 能 希望 通过 减 小 表 的 大 小 看 是 否 能 够 提高 性 能 { 因为 这 样 1O 驻 留 在 内 存 中 的 数据 比例 会 
更 大 )。 

一 般 来 说 ， 在 基准 汕 试 期 问 应 尽 可 能 使 更 秘 的 事务 并 发 ， 每 个 事务 来 日 于 模拟 终 峭 〔( 模 
拟 用 户 在 一 个 简单 的 监视 器 前 项 入 命令 }， 这 些 事务 都 是 一 样 的 ， 同 由 茶 一 特定 的 账户 
{Account .Account_ID = Aiqd)、 出 纳 员 (Tid) 、 支 行 'Bid) 的 值 标识 的 大 量 的 行 的 余 
额 字 段 里 面 加 钱 或 者 取 钱 (此 时 Delta 为 负 值 )。 在 这 过 程 中 一 条 历 忠 行 写 到 相应 的 
History 文 件 中 。 图 10-17 提 供 了 描述 事务 执行 逻辑 的 伪 代 码 。 这 些 事务 只 有 在 
Aid, Tid, Bid 和 Delta 等 参数 上 有 一 些 不 同 。 


tRead 100 bytes from the terminal, including Aid, Tid, Bid, and Delta) 
(BEGIN TRANSACTION} 
Update Account Where Account.Account_ID = Aid 
set Account.Balance = Account.Balance + Delta: 
Insert to History {50 bytes, include column values: Aid, Tid, 
Bid, Delta, Time_ Stamp?} 
Update Teller Where Teiler.Teller ID = Tid 
set Teller.Balance = Teller.Balance + Delta: 













Update Branch where Branch.aratch_ID = Bid 
set Branch.Balance = Branch.Balance + Delta 


COMMIT TRANSACTION 
Write 200 byte message to Terminal，including Aid, Tid, 









Bid, Delta, ACcount.Balance 





图 10-17 TPC-A 雪 淮 测试 的 捉 务 四 辑 
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我 们 可 以 看 到 每 个 提 款 事 荔 对 三 行进 行 更 新 操作 ， 三 无 组 的 记 于 形式 防止 错误 的 发 生 。 
基准 测试 过 程 中 事务 执行 所 需要 的 aia、Tia、Bidg 三 个 参数 的 值 是 在 运行 前 以 这 样 一 种 方式 
随机 产生 的 ， 这 种 方式 能 够 保证 acceunt 表 中 的 所 有 行 被 每 个 事务 更 新 的 机 会 是 平等 的 ， 
TelILer 表 和 Branch 表 也 一 样 。 注 意 ， 在 运行 期 中 设 有 测试 能 保证 增加 到 account 表 行 的 休 
额 中 的 pelta 并 没有 减少 余额 值 到 零 以 下 《〈 因为 对 于 取款 操作 而 言 ，Delta 值 是 负 的 )， 但 是 
这 个 决定 是 由 TPC 委 员 会 做 出 的 ， 对 任何 一 家 供应 商都 是 一 样 的 。 

一 个 详尽 的 基准 测试 说 明 提 供 了 大 量 的 测试 旨 在 确定 系统 是 否 握 供 了 事务 的 ACID 性 质 ， 
即 原子 性 、 一 致 人性、 隔离 性 和 持久 性 。 这 些 测试 不 作为 基准 测试 间隔 的 -部 分 。 图 10-18 中 给 
出 了 在 TPC-AA 基 准 测 斌 说明 的 段落 2.4.2.1 中 列 出 的 隔离 性 测试 ， 这 种 测试 使 用 了 图 10-17 中 的 
事物 执行 逻辑 。 然 而 ， 展 示 和 任 意 的 事务 组 合 都 能 满足 SQL-99 标 准 下 的 完全 可 学 行 化 隔离 级 列 
是 提供 商 的 责任 ， 而 不 仅仅 是 TPC-A 所 要 做 的 。 持久 人 性 测试 包含 导致 运行 系统 中 的 内 存 失 效 
的 原因 并 表明 恢复 操作 可 以 捕 损 完成 的 事务 提交 的 更 新 操作 ， 将 系统 恢复 到 一 个 一 致 点 稳定 
介质 的 失效 恢复 同样 也 可 以 测试 。 需 要 指出 的 一 点 是 History 表 中 的 内 容 不 能 作为 日 志文 件 在 
恢复 过 程 中 使 用 ， 尽 管 History 行 看 上 去 包含 了 执行 恢复 操作 所 需要 的 所 有 有 信息， 但 它 是 由 应 
用 过 程控 市， 它们 可 能 随时 被 删除 。 


囊 冀 1 开始。: 轩 10-17 的 退 辑 ) 
让 COMMIT 之 前 事务 1 立即 停止 。 
2 


务 2 并 始 
事务 2 试图 更 新 种 事务 1 相同 的 记录 。 
验证 事务 2 处 于 等 待 状态 。 

允许 事务 1 完成 。 这 样 事 务 2 可 以 完成 。 
验证 账户 余 烙 反 映 了 两 次 更 新 拘 作 。 





山 10-18 事务 的 隔离 性 测试 { 常规 基 锁 模式 ) 


我 们 在 前 面 提 到 过 我 们 模拟 的 系统 在 基准 测试 过 程 中 从 不 辣 的 终端 接受 大 量 的 事务 请 求 
为 了 说 明 这 些 终端 发 出 请 求 的 频率 和 次 数 ， 我 们 需要 以 下 定义 。 


定义 10.410.1 ”从 单个 终端 发 出 的 两 个 相继 的 训 务 请 求 间隔 的 时 间 称 为 周期 ， 它 由 两 部 分 
组 成 : 响应 时 间 (系统 的 延迟 ) 和 思考 时 间 《【 大 致 等 于 终端 用 户 花 在 思考 上 的 时 间 )。 同 


为 了 执行 有 效 的 TCP-A 基 准 测试 ， 两 次 终端 请 求 之 间 的 思考 时 间 必 须 在 基准 测试 程序 运 
行 之 前 随机 生成 ， 以 便 最 后 的 平均 周期 时 间 最 少 为 10 种 。( 这 是 一 个 略 显 复杂 的 问题 ， 因 为 在 
执行 基准 测试 之 前 我 们 不 知道 淮 确 的 系统 响应 时 间 ， 因 此 我 们 不 知道 需要 多 长 的 思考 时 间 以 
便 获 得 可 能 的 10 秒 平均 周期 。 我 们 只 能 通过 一 系列 的 近似 来 取得 思考 时 间 。) 要 求 有 10 秘 左 石 
的 对 期 的 出 发 点 是 一 个 能 够 有 效 地 服务 1000 个 终端 的 事务 系统 至 少 要 有 100TPS 的 吞吐 量 。 在 
基准 测试 过 程 中 同样 存在 限制 响应 时 间 的 条 件 。 当 只 有 一 个 用 户 时 ， 大 多 被 测试 的 系统 会 给 
出 小 于 一 秒 的 响应 时 间 ,， 但 是 随 着 越 来 越 多 的 用 户 加 入 ，CPU 和 LO 资源 就 会 形成 等 竺 队列 ， 
从 而 导致 响应 变 慢 。 测 试 TPS 的 正规 方法 基本 上 是 这 样 的 : 我 们 以 给 定数 基 的 终端 开始 ， 不 断 
增加 终端 的 数量 ， 每 10 秒 执行 一 个 事务 ， 直 到 10 锡 的 事务 的 啊 应 时 间 超 过 两 秒 。 这 样 做 能 够 
保证 进行 TYPC-A 基 准 测试 的 不 同 供应 商 的 产品 获得 大 致 相同 的 资源 利用 率 。 


定义 10.10.2 ”TPC-A 基 准 测试 的 响应 时 间 标 准 ”在 基准 测试 过 程 中 ，90% 的 事务 的 啊 广 
时 间 必 须 不 超过 2 秒 。 国 
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为 了 运行 测试 程序 ， 需 要 一 守 的 时 间 使 得 并 发 事务 注 趋 于 稳定 ， 直 到 系统 进入 稳定 状态 
( 具有 持续 的 TPS )。 这 个 时 间 段 不 能 少 于 15 分 钟 ， 但 不 能 超过 1 小 时 ， 在 这 过 程 中 必须 作 检 查 
点 。 我 们 假定 在 基准 测试 过 程 中 提供 了 足够 的 磁盘 数量 ， 这 样 在 响应 时 间 标 准 下 期 望 的 资源 
队列 下 CPU 能 够 保持 90 免 的 利用 率 。 使 用 凶 少 碰 盘 取决 于 测试 工程 师 ， 但 是 要 尽 可 能 地 节约 
资源 。 因 为 除了 TPS 这 样 一 个 衡量 指标 之 外 ， 还 有 一 个 重要 指标 就 是 每 个 TPS 的 5 年 系统 开销 
( $COSTITPS ), 

对 于 Set Query 标准 {早期 的 TPC-A 基 准 中 用 来 测量 $COST/QPM 指 标 ) 而 言 ， 开 销 
($COST ) 计算 包括 硬件 开销 包括 终端 和 网 络 )、 加 上 5 年 的 软件 和 维护 费用 。 (这 只 是 一 个 
简单 的 相 如 值 ， 不 是 净 信 的 计算 。)}) 为 了 给 大 家 一 个 事务 处 理 速 度 的 松 念 ， 在 图 10-19 中 给 出 
随机 选择 的 几 个 商业 系统 的 指标 。 对 于 一 个 富 务 系统 而 言 每 秒 儿 月 个 事务 的 TPC-A TPS 指 
标 是 完全 可 能 的 。 一 般 来 说 ， 随 着 TPS 的 增加 ，$COSTATPS 也 会 增加 。 图 10-19 中 的 UNIFY 
2000 系 统 比 较 特 别 ， 


数据 库 系 统 雄性 TPS COSTATPS 口 期 
ORACLE? VAXcuster 4x 000-$80 4259,.70 $16 326 Si12192 


UNIFY 2000 Pyramid MIServer 12%/12 468.45 $5971 B4192 
INFORMIX 4.10 IBM RISC 50007970 110.,32 $2789 T116192 
SYBASE 4.8.1.1 Symmetry 2000/250 173.11 $2770 ADI92 





图 10-19 一 些 商业 系统 的 历史 TPC-A 指 标 


2. TPC-A 基准 测试 的 经 验 教 训 

如 果 事 务 系统 使 用 初级 的 设计 特性 ， 那 么 在 很 多 方面 可 能 造成 性 能 的 瓶颈 。 如 果 系 统 中 
确实 存在 这 些 瓶 实 ， 那 么 TPC-A 基 准 测 试 的 确 能 够 很 好 地 暴 露 这 些 问题 导致 的 性 能 问题 。 起 
初 ， 我 们 认为 TPC-A 事 务 可 以 用 简单 的 交错 CPU 和 桂 务 实现 ， 理 论 上 只 需要 几 生 条 CPU 指令 和 
基于 IO 请 求 以 及 在 提交 前 -- 些 相对 较 少 的 更 新 操作 中 可 。 然 而 并 非 如 此 ， 简 单 事务 于 辑 在 三 
个 方面 造成 撼 颈 : (1 ) 数据 项 加 锁 , (2) 写 到 日 志文 件 , (3) 缓冲 。 

(1) 数据 项 加 锁 

我 们 可 以 注意 到 在 Branch 表 中 的 100 行 以 及 它们 在 Bistoery 表 中 最 近 的 行 在 十 务 执行 过 
程 中 被 频繁 使 用 。 在 图 10-16 中 我 们 可 以 看 到 在 100TPS 的 处 理 能 力 下 ， 每 秒 钟 有 一 个 事务 访问 
该 表 的 一 行 ， 这 意味 着 Branch 表 每 秒 有 一 行 被 加 锁 ， 因 此 在 很 多 情况 下 肯定 会 有 很 多 重合 请 
求 ， 因 此 事务 会 被 迫 处 于 等 待 状态 。 在 这 种 情况 下 ， 许 多 早期 的 系统 在 切换 进程 环境 时 效率 
非常 八 ， 因此 事务 的 乔 吐 量变 小 。 前 面 我 们 提 到 过 在 测试 过 程 中 ，10 锡 的 事务 的 响应 时 间 会 
超过 2 秒 ( 确 应 时 间 标 准 )， 因 此 为 了 达到 事务 处 理 的 要 求 以 每 秒 一 个 事务 的 速率 访问 Branch 
表 的 行 时 会 存在 一 些 癌 题 。 可 以 把 这 视 为 一 个 附加 的 要 求 ， 即 对 Branch 表 行 的 加 锁 时 人 间 不 能 
太 长 ， 防 止 访 问 该 表 的 行 成 为 撼 颈 。 

由 于 历史 的 秩 央 ， 很 多 数据 库 产 品 不 是 在 表 的 行 上 加 链 ， 而 是 在 包括 该 行 的 磁盘 数据 页 
面 上 加 锁 。( DB2 直 到 最 近 才 成 为 这 样 的 产品 ， 没 有 官方 的 关于 TPC-A 基 准 测试 的 测试 数据 。) 
对 数据 真 面 加 锁 简 化 了 加 锁 机 制 的 于 辑 ， 因 为 对 数据 页 面 的 加 锁 在 很 多 种 情况 下 是 必需 的 ， 
比如 调整 页 面 中 行 的 位 置 。 很 明显 ， 如 果 一 个 事务 封锁 了 和 包含 革 行 的 数据 页 面 ， 那 么 舅 外 一 
个 企图 访问 该 页 面 其 他 行 的 事务 就 会 与 它 产生 冲突 ， 从 而 不 得 不 进入 等 待 状态 。 这 种 冲突 类 
位于 在 对 行进 行 加 锁 时 对 同一 行 的 加 锁 冲 突 。 唯 一 的 问题 就 是 对 页 面 的 加 锁 排 斥 了 对 该 页 面 


498 ” 戏 据 库 左 理 、 问 程 与 性 能 


中 其 他 的 行 的 并 发 访问 。 

在 TPRC-A 基 准 测 试 中 和 两 张 表 采 用 页 面 的 加 锁 机 制 时 有 可 能 导 化 吞吐 莉 的 问题 : 
Branch 表 各 History 表 。 因 为 没有 新 的 行 插 人 到 Account 表 和 Tel1er 表 中 ， 我 们 希 沁 
在 TPC-A 基 准 测试 过 程 中 能 够 将 这 两 张 表 全 部 装载 到 内 存 中 。 对 于 Branch 才 中 的 100 字 节 
的 行 面 言 ，-- 个 DB2 的 数据 页 面 能 够 存放 40 行 。 每 个 事务 在 执行 过 程 中 会 向 History 表 中 
需 序 插入 行 ， 担 是 我 们 希望 料 这 些 行 尽 可 能 放置 得 更 为 紧凑 些 ， 因此 得 个 DB2 数 据 页 面 能 够 
存 训 80 个 50 字 节 的 行 。 因 此 对 行 的 加 锁 对 寺 TPC-A 保 证 足够 的 并 发 性 方面 显得 尤为 重要 。 划 
果 使 用 对 页 面 加 锁 的 机 制 ， 对 Branch 表 而 并 上 其 余 39 行 也 将 被 锁 住 ， 这 将 造成 严重 的 拱 颈 ， 
局 样 ， 对 于 History 表 而 言 ， 每 个 事务 对 该 表 的 搬 人 行 操作 是 顺序 进行 的 ， 这 意味 着 新 的 
事务 总 是 在 该 表 的 最 后 一 个 数据 页 面 中 播 人 行 。 我 们 可 以 假设 该 页 面 经 常 使 用 ， 因 此 放 在 内 
存 缓 冲 中 。 如 果 使 用 对 页 面 的 加 锁 机 制 ， 将 排斥 其 他 很 多 并 发 事务 对 该 页 面 进 行 揪 人 
History 行 的 操作 。 事 务 将 一 直 持 有 该 锁 上 由 到 事务 提交 ， 系 统 将 日 志 绥 神 区 写 到 日 志文 性 
中 ， 我 们 可 以 预 凡 该 过 程 至 少 要 花 1180 秘 (根据 我 们 对 随机 WO 的 了 解 .因此 如 果 采 用 对 页 
面 加 锁 的 机 制 ， 事务 系统 的 最 大 事务 吞吐 量 只 能 达到 80TPS 。 

为 了 解决 页 面 加 锁 协 议 导 致 的 瓶颈 问题 ， 数 据 库 管 理 员 DBA 可 以 做 一 些 工 作 ， 比 如 将 
Branch 表 和 History 表 配置 成 每 行 存 放 在 单独 -- 个 页 面 中 。 这 样 做 会 浪费 大 量 的 空间 .但 
是 至 少 在 使 用 页 面 吉 锁 协 议 时 ， 只 会 对 单行 进行 加 锁 ， 因 此 可 以 认为 前 面 提 到 的 瓶 闫 问题 得 
到 解决 。 那 么 采用 这 种 策略 在 磁盘 空间 和 绥 冲 区 上 我 们 付出 的 代价 是 什么 呢 ? 对 于 Branch 表 
而 言 ， 在 1TPS 的 处 理 能 力 下 只 需要 一 行 ， 即 一 页 面 磁盘 空间 。 因 此 在 100TPS 的 处 理 能 力 下 需 
要 100 个 伐 盘 页 面 。 这 对 于 硫 盘 空间 而 言 并 算 不 了 什么 ， 即 使 所 有 这 些 磁盘 页 面 都 放 在 内 存 绥 
冲 区 中 ， 对 于 内 存 开 销 面 言 也 不 算 太 大 。 根据 我 们 在 7.2 节 中 所 到 的 费用 经 验 规则 ，100 个 4KB 
的 矿 盘 页 面 对 于 每 如 磁盘 空间 1000 美 元 的 价格 来 算 ， 只 需要 0.40 美 元 。100 个 内 存 缓冲 页 面 对 
于 $SOMB 的 内存 价格 ， 和 需要 20 美 元 。 

对 于 History 表 而 言 ， 我 们 只 需要 在 内 存 中 保存 部 分 的 数据 页 面 ， 事务 将 在 最 近 使 用 
的 磁盘 页 面 中 进行 顺序 邮 插 大， 因此 内 存 开 销 可 以 更 小 。 介 是 磁盘 开销 在 些 不 同 。TPC-A 基 
准 测 试 说 明 ( 10.2.3.1 ) 中 开销 的 计算 要 求 包括 在 规定 的 事务 处 理 能 力 下 存放 90 天 (每 天 8 
小 时 ) 的 历史 行 所 需要 的 在 线 磁 盘存 情 空 间 的 价格 。 那 么 在 1TPS 的 处 理 能 力 下 : 有 90x8x 
60 x 60=2 592 000 个 历史 行 。 假 定 每 个 磁 扒 页 面 为 4KB， 那 么 100TPS 的 处 理 能 力 必 须要 有 
252 200 000 个 磁盘 页 面 即 大 约 1009GB 的 磁盘 空间 ， 这 些 空 间 大 约 需 则 2 百 万 美元 。 和 击 如 琳 
用 每 页 存 80 行 的 方法 ,那么 只 需要 25 000 美 元 。 这 样 庞大 的 历史 行 存储 开销 将 严重 影响 系统 
的 $COST/TPS 指 标 ， 这 是 TPC-A 基 惟 测 试 对 原始 的 页 面 加 锁 机 制 的 一 种 惩 笠 。 可 能 值得 欣 
奈 的 是 ，90 天 Hi story 表 的 在 线 存储 是 一 个 相对 比较 实际 的 要 求 ， 因 此 在 商业 系统 中 可 能 
被 条 用 。 

{2) 写 到 日 志文 件 

在 磁盘 上 的 日 志文 件 通常 是 一 种 顺序 文件 的 形式 存在 的 ， 因 此 恢复 过 程 必 须 按 放 阐 顺 邦 
读 人 日 志 记 录 项 。 当 连续 的 事务 提交 和 写 回 日 志 缓冲 区 的 操作 发 生 时 ， 在 一 个 磁盘 写 操作 开 
始 到 下 一个 磁盘 写 操作 之 间 有 一 段 较 “ 艰 难 ” 的 时 间 。 根 据 随 机 IO 的 最 小 速率 每 秒 80 次 IO 
操作 可 以 用 来 合理 地 估计 写 日 志文 件 的 速度 。 根 据 我 们 前 面 的 讨论 ， 在 简单 的 机 制 下 当 事 务 
提交 时 系统 必须 将 日 志 缓冲 区 写 回 到 磁盘 上 ， 这 意味 着 我 们 每 秒 钟 最 多 内 能 处 理 80 个 事务 ， 


囊 J0 音 更 新 事 关 499 


即 最 大 速率 80TPS。TPC-A 基 淮 测 试 程序 使 用 非常 简单 的 事务 逻辑 ， 可 以 发 现 这 类 插 颈 问题 。 
就 像 我们 在 图 10-19 中 看 到 的 那样 ， 每 秒 儿 月 个 事务 的 处 理 速度 相对 而 言 是 非常 普通 的 。 在 给 
定 的 写 日 志文 件 的 限制 下 ，、 是 如 和 何 达 到 这 样 的 速度 的 呢 ? 

获得 比 日 志 交 件 WO 速 率 更 高 的 上 事务 处 理 TPS 的 一 个 可 能 的 方法 是 采用 一 种 称 为 组 提交 的 
复杂 设计 。 这 种 方法 的 基本 思路 是 ， 改变 每 个 事务 提交 时 都 进行 写 日 志 缓 冲 区 到 日 志文 件 的 
做 法 ， 人 允许 看 写 加 日 志 组 冲 区 之 前 让 一 组 事务 提交 。 当 锥 事务 提 变 操作 必须 等 到 日 志 组 冲 区 
写 回 到 磁盘 上 时 才 算 完成 ( 直到 取款 操作 的 行 被 存储 到 稳定 存储 器 上 银行 才 会 付 钱 }。 这 意味 
着 发 出 提交 操作 的 事务 必须 处 于 等 待 状态 ， 直 到 它 的 提交 日 志 项 写 到 磁盘 上 ， 靶 使 写 回 操作 
不 是 立即 执行 。 但 是 没 必要 担心 等 符 的 时 间 会 过 长 , 因为 这 样 做 的 和 眼 的 只 是 获得 更 高 的 TPS 值 。 
如 果 一 组 事务 的 提交 完成 时 间 过 长 ， 我 们 可 以 不 必 等 待 写 到 日 志文 件 的 完成 。 我 们 只 是 不 得 
不 忍受 较 慢 的 写 回回 度 一 一 每 秒 80 次 ， 也 就 是 说 我 们 不 能 摆脱 磁盘 WO 速率 的 束缚 。 基 本 上 采 
用 组 提交 策略 的 事务 系统 在 下 面 两 个 事件 发 生 时 与 日 志 缕 冲 区 到 磁盘 : 

1) 内 存 中 的 日 志 缓 冲 区 已 满 。 

2) 自从 上 次 与 到 日 志文 件 之 后 ， 已 经 过 了 1780 秒 。 

典型 的 日 志 组 冲 大 小 为 16KB 或 者 更 大 一 些 ， 因 此 对 于 较 高 的 TPS 能 力 ， 在 写 日 志 缓 冲 区 
之 前 该 缓冲 区 应 该 能 够 存放 足够 的 日 志 项 。 

(3) 缓冲 策略 和 5 分 钟 规 则 

执行 图 10-17 中 的 事务 逻辑 时 到 底 需要 多 少 实际 的 磁盘 11O ( 当 所 要 的 数据 页 面 不 在 内 存 中 
时 )? 《此 处 ， 写 日 志 缓 部 区 的 操作 不 计算 在 内 。) 很 明显 ， 这 依赖 于 TPC-A 基 准 测 试 间 归 内 
进入 稳定 状态 之 后 ， 内 存 中 存放 的 是 哪些 数据 和 和 索引。 我 们 也 许可 以 购买 足 锯 的 内 存 来 扩大 
我 们 的 缓冲 区 ， 使 得 所 有 的 数据 都 能 够 存放 在 内 存 中 ， 但 是 这 会 增加 系统 的 $COST7TPS 指 标 。 
测试 证 明 将 Branch 表 和 Tel1etr 表 中 的 行 存 放 在 内 存 中 能 够 获得 较 好 的 效果 ,但 是 要 想 将 
acceount 表 中 所 有 的 行 都 存放 在 内 存 中 基 不 现实 的 。 

我 们 确定 哪些 数据 放 在 内 存 中 能 较 大 地 改善 系统 的 性 能 ， 我 们 使 用 Jim Gray 各 Franco 
Puzolu 在 1987 年 提出 的 5 分 钟 规则 (参见 推荐 读物 [3D)。 他 们 指出 在 内 人 存 中 存放 磁盘 数据 的 目的 
是 进行 IO 操作 时 磁盘 读 写 苹 的 移动 时 间 尽 可 能 小 。 更 多 的 内 存 可 以 使 我 们 茂 少 需要 购 天 磁盘 
的 数量 《我们 假定 我 们 可 以 将 相同 的 数据 放 在 多 个 磁盘 .上 )。 考 虑 到 这 一 点 ， 我 们 愿意 花 更 多 
的 钱 购买 足够 的 内 存 作 为 缓冲 区 。 作 为 花 钱 购买 更 多 的 内 存 的 拆 囊 措施 ， 我 们 可 以 将 更 多 的 
磁盘 数据 放 在 内 存 中 ， 这 样 可 以 减少 购买 磁盘 上 的 投资 。 在 给 定 的 工作 负载 、 内 存 价 格 和 磁 
盘 价 格 条 件 下 ， 存 在 一 个 合理 的 临界 点 使 得 我 们 对 内 存 的 投资 效果 达到 最 好 。 磁 盘 页 而 的 使 
用 情况 用 两 次 数据 访问 之 问 的 时 间 来 衡量 ， 访 问 的 频率 越 高 说 明 赵 常用 。Gray 利 Putzoiu 指 出 
两 次 访 癌 之 间 的 时 间 僻 隔 决 定 了 什么 时 候 我 们 可 以 停止 购买 更 多 的 内 看 作 为 缓冲 区 ， 这 个 时 
间 大 约 是 5 分 钟 一 -因此 我 们 称 为 5 分 钟 规则 。 但 是 在 稍微 不 同 的 前 提 假 设 下 我 们 得 到 的 时 间 
癌 隔 超出 了 我 们 预计 的 值 ， 我 们 将 推导 我 们 的 结论 。 

例 10.10.1 5 分 钟 规则 简单 起 见 ， 假 定 我 们 为 一 个 五 年 内 工作 负载 不 变 的 系统 购买 磁 委 
和 内 存 ， 因 此 我 们 不 必 担 心 短 时 间 的 租 率 。 购 买 更 多 的 磁盘 我 们 可 以 获得 音 高 的 磁 圾 访问 速 
度 ， 因 为 对 于 每 个 数据 页 面 的 我 们 可 以 重复 存放 在 多 个 磁盘 上 ， 每 个 磁盘 可 以 同时 读 取 该 数 
据 页 面 的 不 同 部 分 的 数据 ， 从 而 提高 整体 的 访问 速率 。( 有 些 磁盘 有 多 个 磁盘 臂 ， 可 以 同时 在 
不 同 的 区 域 读 取 数 据 。) 当然 买 更 多 的 磁盘 需要 更 多 的 投资 。 比 如 ， 在 200TPS 的 处 理 能 力 下 ， 
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按照 TPC-A 基 准 测试 Account 表 和 包含 2 亿 行 ， 每 行 有 100 个 字 和 节 ， 也 就 是 说 需要 2GB 的 空间 
[我们 现在 忽略 索引 所 需要 的 空间 )。 商 业 上 ， 现 有 的 磁盘 容量 为 每 个 磁盘 臂 笠 理 10GB ， 最 大 
的 MO 谤 问 速度 为 每 秒 80 个 IO 操作 ， 我 们 很 定 10GB 的 伐 盘 价格 为 500 美 元 。 在 200TPS 的 处 理 
能 力 下 ， 每 秒 要 对 Account 表 执行 200 次 读 操 作 和 200 次 写 操 作 。 对 于 每 个 磁极 璧 每 秒 50 次 
TO 操作 的 正常 速度 { 比 最 大 速度 每 秒 80 次 LO 操作 要 小 一 些 ， 因 为 要 达到 100% 的 磁盘 利用 深 
不 太 可 能 )， 这 意味 着 至 少 需要 8 个 磁盘 臂 问 时 对 Account 表 进 行 操作 。 因 为 Account 表 包 含 
2GB 的 数据 ， 而 80GB 的 磁盘 空间 需要 8 个 磁盘 癌 。 我 们 可 以 看 到 空间 利用 率 只 有 大 约 2.5 和 9 。 
存放 account 表 的 8 个 磁盘 大 约 需要 4000 美 元 。 如 果 我 们 可 以 将 这 些 数据 全 部 放 在 内 存 中 而 
不 是 存放 在 磁盘 上 ， 我 们 可 以 减少 所 需 磁 盘 臂 的 数量 。 整 个 Account 表 内 需要 放 在 一 个 磁 盟 
上 ， 可 以 节省 大 约 3500 美 元 。 

将 2GB 数 据 放 在 内 存 中 需要 8000 美 元 的 代价 {每 GB 4000 美 元 )， 因 此 将 整个 Account 表 放 
在 肉 存 中 来 节省 3500 美 元 的 磁盘 开销 是 不 适合 的 。 但 是 如 果 内 存 的 价格 降 到 足够 低 ， 比 如 等 
GB 1000 美 元 ， 而 磁盘 的 价格 仍然 维持 不 变 ， 那 么 将 整个 aceount 表 存放 在 内 存 中 是 合 返 的 ， 
因为 此 时 只 需要 2000 美 元 ， 就 可 以 节省 3500 美 元 的 磁盘 开销 。 从 这 个 例子 中 我 们 看 出 到底 
用 多 大 的 内 存 作为 缓冲 区 是 --- 个 内 存 价格 和 磁 表 价格 的 折 刘 方案 。 加 


例 10.10.2 ”关子 5 分 钟 规则 更 多 的 内 容 ”在 与 例 10.10.1 相 同 的 假设 条 件 下 ， 我 们 米 推 导 
伐 盘 页 而 的 引用 频率 的 临界 值 。 当 磁盘 访问 的 频率 处 在 该 临界 值 时 ， 将 数据 存放 在 由 他 中 和 
存 必 在 磁盘 上 具有 相同 的 花费 。 假 定 这 个 值 为 X, 单位 基 每 秒 钙 内 对 一 个 数据 页 面 ( 4KB 数 据 ) 
的 访问 次 数 。 假 定 内 存 价格 为 s4000/GB， 则 在 内 存 中 保留 4KB 数 据 的 花费 为 $44000/256 000 
( 1GB/4KB = 256 000 )， 即 : 

驻 留 内 存 的 花费 = $4/256 = $0.015625 

另 -- 方 面 ， 我 们 可 以 使 用 由 X/50 给 出 的 磁盘 臂 来 完成 每 秒 X 次 存 取 ， 恨 定 当 没有 等 符 队 列 
时 每 个 磁盘 莹 平均 每 秒 炒 理 50 个 /OQ 操 作 。 因 为 每 个 位 副 的 价格 为 1000 美 元 {根据 图 8-2 的 数 
字 )， 这 意味 着 当 该 页 而 在 磁 肯 上 时 提供 每 秒 X 次 存 取 ， 覃 求 的 花费 是 : 

驻 留 斑 盘 的 花费 = $1000 x (U50) = XX x $20 

在 临界 值 时 两 个 花费 应 该 相等 ， 因此 我 们 可 以 通过 求解 下 面 这 个 简单 的 方程 来 获得 临界 值 。 

$0.015625 = X x $20 

求解 这 个 方程 ， 我 们 可 以 得 到 X=0.00078125， 这 是 每 秘 的 存 取 次 数 , 或 者 说 每 阱 
1/0.00078125=1280 秘 才 会 发 生 一 次 磁盘 访问 ， 这 是 访问 间隔 的 临界 值 。 经 常用 到 的 数据 页 面 
可 能 不 需要 1280 秒 这 么 长 的 间隔 就 会 发 生 一 次 磁盘 访问 ， 也 就 是 说 有 相对 较 大 的 X 值 。 我 们 
可 以 看 到 随 着 的 增 大 ， 驻 留 磁盘 的 解决 方案 花费 增 大 ， 面 驻 留 内 存 的 解决 方案 花费 不 变 。 因 
此 那些 经 常 要 访问 的 数据 页 而 适合 放 在 内 存 中 。 反 过 来 对 于 不 经 常 访问 的 数据 页 面 (平均 访 
问 间隔 太 于 1280 秒 的 数据 页 面 ) 则 适合 放 在 磁盘 上 。 国 

注意 ，1280 种 大约 比 21 分 钟 多 一 些 ， 因 此 我 们 可 以 看 到 和 随 着 内 存 价格 快速 下 降 ! 比 磁 向 
价格 的 下 降 速 度 要 快 得 多 )，5 分 钟 规则 变 成 21 分 钟 规则 。 现 在 ,内 存 的 价格 仍然 比 磁盘 的 价 
格 要 降 得 快 ， 因 此 随 着 内 存 变 得 越 来 越 便宜 ， 这 个 临界 访问 间隔 会 变 得 越 来 武 长 。 冉 过 20 什 
这 个 临界 访问 间 忆 将 变 得 非常 长 。 
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有 趣 的 是 TPC-A 基 准 测 试 的 缓冲 机 制 并 不 特别 关心 响应 时 间 。 事务 操作 过 程 可 能 花 太 2 秘 ， 
而 额外 的 WO 操作 贞 花 去 50 毫 秒 ， 因 此 实际 上 我 们 可 以 忽略 后 者 。 我 们 关心 的 好 的 缓冲 策略 是 
减少 系统 的 费用 $COST。 在 TPC-A 基 准 测 试 过 程 中 较 好 的 事务 显示 对 每 个 事务 而 言 实际 的 IO 
次 数 为 每 张 表 2 次 多 一 点 。 如 果 acccount 表 的 索引 使 用 散 列 算法 可 能 会 有 更 好 的 绩 果 ， 央 为 
使 用 B 树 结构 的 话 有 可 能 使 叶 节 点 不 能 放 刘 缓冲 区 中 ， 从 而 使 得 IO 的 次 数 可 能 超过 每 秒 3 次 。 
Teller 表 和 Branch 表 的 访问 频率 比 Account 表 的 访问 师 率 要 痪 得 和 多， 因 浊 在 内 存 中 的 驻 留 
时 间 也 会 更 长 一 些 ， 许 多 事务 要 对 它们 进行 更 新 操作 。 很 明显 ， 当 我 们 对 某 个 缓冲 页 而 进行 
更 新 时 不 应 该 立即 将 这 些 数据 页 面 写 凹 到 伐 和 上 。History 表 只 而 要 每 80 个 事务 与 辕 一 次 ， 
假定 该 去 的 行 信 可 能 幕 次 地 存放 在 该 页 面 上 。 
频繁 访问 的 数据 我 们 称 为 搁 有 热度 。 当 数据 友 是 够 的 访问 频率 时 就 可 以 放 在 内 存 色 剖 区 
了 ， 这 些 数据 称 为 热 数据 。Branch 表 和 Teller 表 就 是 这 样 的 例子 。 当 数据 不 再 需要 存放 在 
缓冲 区 中 时 ， 为 了 提供 更 快 的 人 磁 稚 璧 服务 这 些 数据 就 要 以 尽 可 能 快 的 方式 写 电 到 磁盘 上 ， 我 
们 称 这 些 数 据 为 县 数 据 。 我 们 可 以 在 acceunt 表 中 看 到 这 种 操作 。 事 务 系统 通常 处 理 的 是 暖 
数据 。 另 一 方面 ， 对 于 查询 系统 而 言 经 常 有 这 样 的 情况 : 具有 非常 大 的 存储 需求 贡 相 对 较 低 
的 并 行使 用 需求 ， 因 此 存储 能 力 就 成 为 影响 性 能 的 一 个 重要 因素 ， 我们 称 这 些 数据 为 冷 数 据 。 
History 志 就 代表 冷 数 据 ， 但 它 需 要 在 内 存 中 保留 一 个 缓冲 区 接受 新 插入 的 数据 ， 因 为 当 这 
些 记录 写 之 后 没有 实时 的 引用 【 至少 在 TPC-A 基 准 测 试 程序 中 没有 )。 
推荐 读物 
在 这 里 ， 我 们 要 推荐 两 本 关子 事务 的 教科 书 。 第 一 -本 是 由 Bernstein 、Hadzilacos 种 
Goodman 写 的 [1]。 该 书 已 经 不 再 印刷 ,但 是 可 以 从 其 他 渠道 获得 该 书 ， 可 以 从 http:iiresearch. 
microsoft, com/pubsiccontrol/default.htm 下 载 该 书 的 PDF 格 式 的 文件 。 这 本 书 主要 证 明了 本 章 
中 提 到 的 各 种 方法 的 正确 性 。 而 且 该 书 还 涉及 到 了 模糊 检查 点 的 一 - 些 实现 技术 。 本 章 中 没有 
提 到 的 很 多 的 并 发 和 恢复 方法 在 该 书 中 有 详细 的 表述 ， 比 如 多 版 本 并 发 和 屏 项 技术 。( 这 些 方 量 
法 在 现在 的 商业 系统 中 很 少 使 用 ,但 是 这 种 情况 在 将 来 可 能 会 改变 )。 
第 二 本 书 是 Gray 和 Reuter 写 的 [2]。 该 书 从 另 一 方面 向 读者 展现 了 我 们 在 本 章 中 讨论 的 数 
据 库 特征 的 具体 实现 细节 ， 还 有 其 他 很 多 内 容 。 证 明 已 经 给 出 ,但 是 主要 的 焦点 是 如 何 让 数 
据 库 |: 作 起 来 。 这 是 一 项 基本 的 工作 ， 没 有 它 任 何事 务 系 统 都 不 可 能 获得 成 功 。 
[1] PA.Bernstein, VY.Hadzilacos, and N.Goodman. Concurrency Control and Recovery in 
Darabase Systrems. Reading, MA: Addison-Wesley, 1987 
[2] Jim Gray and Andreas Reuter. Transaction Processing: Concepts and lechniques. San 
Mateo, CA: Morgan Kaufmann, 1993. 
[3] Jim Gray and Franco Putzolu. “The 5-Minute Rule for Trading Memory for Disc 
Accsses and the 10-Byte Rule for Trading Memory for CPU Time， Proceedings of the 
1987 ACM SIGMOD Conference, pp.395-398. 
[4] K.Kant. Introduction to Computer System Performance Evaluation. New York: Mectraw- 
Hill, 1992. 
[5] Hal Berenson, Phil Bernstein, Jim Gray, Jim Melton, Elizabeth OO” Neil, and Patrick OO 
Neil. " A Critique of ANSI SQL Isolation Levels.” Proceedings of the 1993 ACM 
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SIGMOD Conference, pp. 1-10. 
习题 


用 "标记 的 习题 在 书后 的 “习题 解答 ”中 给 出 了 管 案 。 
10.1 ”这 个 习题 中 ， 恨 定 每 个 事务 每 次 使 用 CPU 时 间 片 为 10ms， 每 次 JIO 操 作为 50ms。 和 
例 10.2.1 中 的 讨论 相似 ， 只 是 参数 有 些 不 同 ， 考 虑 下 面 的 问题 : 
(a)* 使 用 图 10-6 中 给 出 的 方法 ， 画 一 张 等 价 的 资源 利用 图 ， 要 求 司 用 最 多 的 磺 盘 数 
和 最 多 的 模拟 事务 线程 ， 通 过 理想 的 资源 重 秋 获得 最 优 的 吞吐 量 。 假 定 每 个 事 
务 要 求 两 次 LO 操作 和 两 个 CPU 时 间 片 。 求 最 终 的 事务 吞吐 量 ， 以 TPS 为 单位 。 
{b) 考虑 更 为 实际 的 情况 ， 我 们 采用 统计 学 的 资源 分 配方 法 。 在 10 个 磁盘 上 进行 数 
据 的 随机 分 配 。 恨 定 在 某 个 时 刻 育 20 个 并 发 事务 ， 队 列 中 5 个 事务 使 用 CPU ， 另 
外 15 个 在 使 用 磁盘 JO。 
(in 以 类 似 于 向 10 个 磁盘 上 投掷 15 支 飞镖 的 模式 。 计 算 磁 盘 数 日 的 期 望 值 ， 要 求 
不 必 称 动 磁盘 臂 。 并 给 出 这 种 情况 下 的 磁盘 利用 率 。 不 要 使 用 近似 的 方法 。 
(i) 在 队列 中 有 5 个 事务 使 用 CPU 的 模式 下 {类似 于 在 散 询 中 平均 队列 长 度 为 5 )， 
计算 CPU 的 利用 率 。 
10.2 绘制 下 面 两 个 经 历 的 前 趋 图 
(3 WAA) RA) WZ) RAB) WY) WAB) CC, C, 
(b) WD) RID) WFY W2(P) RAGY WCGTC CC， 
10.3* 考虑 下 面 的 经 历 : 
RAT) WAJ) RAA) RDBILRABJ) WAHAB)} OC, 
该 经 历 的 前 趋 图 中 有 一 个 回路 ， 然 而 我 们 可 以 证 明 如 果 我 们 依照 该 经 历 在 数据 库 中 单独 
_ 执行 一 浪 ， 不 会 发 生 任 何不 一 致 的 情况 。 事 务 T, 确 实 看 到 了 事务 T, 的 部 分 结果 ， 但 是 它 没有 
` 采取 任何 操作 ， 因 此 没有 影响 磁盘 数据 。 另 一 方面 事务 T, 看 到 的 是 一 致 的 数据 ， 因 为 T, 没 
有 做 任何 更 新 。 困 此 有 人 也 许 会 问 : 为 什么 我 们 必须 说 这 样 的 经 历 是 不 可 串 行 化 的 ， 既 然 唯 
一 的 不 可 串 行 化 的 数据 视图 对 最 终结 果 并 没有 什么 影响 。( 这 一 说 法 的 缺陷 在 于 如 果 它 看 到 了 
一 致 性 数据 视图 T, 有 可 能 采取 其 他 的 操作 。) 说 明 并 给 出 该 经 历 的 一 个 解释 ， 其 中 这 种 不 一 致 
性 可 能 产生 问题 。 
10.4 ”证 明 如 果 PG(HD 图 中 有 回路 ， 那 么 不 存在 不 具有 PG(H) 图 的 自 右 间 左 的 边 的 事务 序 
列 。( 这 是 可 串 行 性 定理 的 一 部 分 ， 在 此 留 作 习 题 ) 
10.5。 说 明 锁 调度 器 会 如 何 处 理 下 面 的 操作 序列 ， 使 用 类 似 于 例 10.4.2 的 方法 。 
RA) RAA) WAT WA)C, C, 
10.6 ” 像 前 面 的 习题 那样 ， 说 明 锁 调度 器 会 如 何 处 理 下 面 的 事务 操作 请 求 序列 。 通 出 死 锁 
发 生 时 的 等 竺 图 。 | 
(ae WA) RA) WZ) RAAB) WY) WABIC, C, C, 
(b) WD) Wi(F) RAD) WAF) RO) WO)C, C, ©, 
10.7 在 下 面 的 假设 条 件 下 考虑 内 存 的 磁盘 页 面 高 速 绿 溃 机 制 : 首先 ， 总 速 缓存 磁盘 页 面 
区 为 空 ， 高 速 缓存 中 能 保留 的 最 大 页 面 数目 为 4 个 页 面 (这 是 一 个 不 切实 际 的 数字 ， 此 处 作为 
理解 练习 使 用 )。 假 定 经 历 中 要 访问 的 数据 项 A，B，C，D，B，F 位 于 不 同 的 页 面 。 


过 10 划 碍 晰 事 窜 3503 


H = RI(A,1) RB,2) WA RAC4) WB,5) C, WC,6) RD,7) 
RE,8) W,(E,9) RB,S) RA,3) REF10 WAE11) WD,12) 
{a)* 指出 第 一 个 操作 ， 当 执行 该 操作 时 为 了 读 入 新 的 数据 贞 面 . 缓冲 区 中 的 某 个 数 
据 页 面 必须 被 替换 出 去 。 
{b) 如 果 缓 冲 区 中 的 数据 页 面 在 缓冲 区 中 被 更 新 之 后 ,没有 写 上 到 它们 所 在 的 磁盘 
FE， 我 们 称 这 个 缓冲 区 中 的 页 面 是 脏 的 。 指 出 看 执行 (a) 中 的 操作 时 ， 内 存 中 有 
哪 几 个 脏 的 数据 页 面 。 
(ch 很 定 我 们 使 用 LRU 模 式 并 且 只 有 在 对 页 面 进行 读 号 操作 时 我 们 才 认 为 该 页 面 处 
于 使 用 状态 。 指 出 在 执行 (a) 中 的 操作 时 ， 哪 个 页 面 将 被 蔡 换 出 去 。 
(dj 我 们 是 省 可 以 简单 地 将 (ce) 中 指出 的 页 面 寺 卉 ， 趟 管 它 的 什 ， 或 者 必须 采取 其 他 
某 些 措施 ”为 什么 ? 
(e)* 当 在 上 面 的 经 历 执行 C, 时 ， 该 操作 是 否 会 导致 带 有 事务 T, 修 改 的 数据 项 的 页 面 
被 强制 秽 出 ? 
( 列 出 上 面 所 有 的 操作 以 及 执行 每 个 操作 后 存放 在 缕 神 区 中 的 数据 项 砚 面 以 此 它 
们 当时 的 值 ， 如 果 当 时 缓冲 区 中 的 值 和 磁盘 上 的 值 不 一 样 ， 那 么 也 列 出 该 数据 
项 在 伐 盘 上 的 值 。 下 面 是 你 应 该 使 用 的 格式 的 一 个 例子 。 


操作 缓冲 区 数据 项 的 值 磁 琢 上 的 不 同人 
Ri(A,1) A=1 

R,(B.2) A=1, B=2 

W(A,3) A=3, B=2 A=!】 


10.8 ”在 下 面 的 经 历 中 。 我 们 假定 在 该 经 历 开 始 之 前 没有 任何 事务 行 在 ， 每 个 事务 以 下 而 
列 出 的 操作 作为 开始 的 第 一 个 操作 ， 类 似 于 例 10.8.1。 对 于 每 个 经 历 ， 提 供 下 列 间 刁 的 解 管 : 
0 假定 使 用 融 速 缕 存 一 至 性 检查 点 ， 写 出 这 些 操作 产生 的 日 志 记 录 项 。 
(证 从 磁 生 上 的 日 志文 件 的 最 后 一 个 日 志 项 开始 ， 写 出 高 速 缓存 安全 的 ROLLBACK 
和 ROLL FORWARD 操 作 序 列 。 
fiii) 像 例 10.8.1 那 样 画 出 事务 持续 的 时 序 图 。 
fajs H1 = R2(A 1) RilB, 2) WilB, 3) Ra(C, 4) WatA, 5) WatC, 6} CKPT Ra 
{D, 7) RotF, RY WolE, 9) C2 RatE, 9) WatD, 11) Crash 
{by H2= RiA, 1) WilA, 3) R2tD, 2) RatB, 4} C1 WalD, 5) WalB, §) 
CKPT RatC, 7) RalE, 8) WtE, 9} C2 RatE, 6) WatC, 11} Crash 
10.9* 在 下 面 给 出 的 时 序 岁 中， 在 做 了 一 个 遍 速 组 上 破 一 敏 性 检查 点 之 后 系统 崩 江 。 下 而 各 
个 事务 的 持续 时 间 具 是 示意 性 的 。 证 明 为 什么 这 是 正确 的 ， 然 后 考 了 三 每 种 情 沈 并 解释 为 什么 
我 们 在 前 面 讲述 的 恢复 过 程 能 够 在 该 情况 下 正确 了 二 作 。 你 要 向 的 不 仅 是 向 自己 也 要 向 别人 证 
明 该 算法 是 正确 的 。 
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10.10 ”使 用 高 速 缓存 一 至 性 检查 点 时 ， 是 否 有 可 能 某 个 事务 的 活动 期 跨 这 不 I 上 一 个 检查 
点 ?如 时 不 可 能 说明 原 因 。 如 时 有 可 能 ， 解 释 恢复 措施 仍然 能 吏 起 作用 的 原因 。 

10.11。 给 出 一 个 至 少 包 会 三 个 事务 (T ，T,,T,) 的 经 历 理 ， 该 既 历 具有 下 面 的 属性 : ( 1) 
事务 T, 的 每 个 操作 都 在 事务 T, 的 任何 一 个 操作 之 前 ， 而 事务 T, 的 每 个 操作 都 在 事务 T, 的 任何 一 
个 操作 之 前 (2) 在 串 行 图 SG(H) 中 ， 我们 有 以 下 关系 Tj 一 T, 各 T, 一 了 ,。 写 出 等 价 的 捉 行 经 
历 。( 提示 : 你 需要 另外 两 个 事务 T, 和 T;,， 并 县 SG(H) 中 的 序列 是 遵循 传递 性 的 .。) 指出 一 点 ， 
我 们 在 此 处 没有 定义 锅 机 制 。 因 此 你 可 以 自由 地 设计 可 串 行 化 经 历 ， 独 立 于 锁 机 制 带 来 的 时 
序 上 的 限制 。 

10.12 让 我 们 回想 一 下 在 鲍 10.5.3 中 提 到 的 幽灵 问题 。 幽 多 辣 题 的 一 个 典型 的 例子 是 : 一- 
个 事务 通过 捅 人 操作 回 革 个 集合 中 语 加 了 一 个 新 的 行 ， 而 另外 一 个 事务 正在 这 些 行 上 执行 革 
些 集合 操作 ， 从 而 使 后 者 得 到 不 一 致 的 结果 。 请 解释 -一 下 谓词 锁 是 如 何 解 决 这 个 问题 的 。 很 
设 事务 T, 要 统计 数学 系 的 雇员 人 数 ， 而 与 此 局 时 事务 T, 需 要 向 该 系 添 加 一 条 新 的 和 雇员 记录 。 

(a) 说 明 在 不 使 用 谓词 锁 的 情况 下 幽 东 问题 是 如 笨 发 生 的 。 
hb) 使 用 请 词 锁 的 情况 下 ，T 锁 的 是 什么 数据 ， 是 什么 模式 的 锁 ? 
(c) T; 锁 的 是 什么 数据 ， 是 什么 模式 的 锁 ? 

(d) 该 方法 是 如 何 解决 晓 灵 问题 的 ? 
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在 前 几 章 中 我 们 讨论 了 传统 数据 库 的 大 部 分 概念 ， 但 这 些 慨 念 都 局 限于 旧 模 式 下 单 CPU 
数据 库 系 统 框架 的 计算 机 环境 。 在 这 种 环境 下 ， 一 般 是 多 个 终端 连接 到 一 个 单 CPU 的 主机 上 ， 
而 这 个 主机 的 芒 能 很 强 ， 一 般 有 多 个 磁盘 驱动 器 。 这 种 结构 的 模式 如 图 11-1 所 示 。 这 里 相 打 
算 在 这 种 框架 上 做 过 多 的 讨论 ， 只 是 假设 
单 CPU 进 行 的 是 分 时 计算 ， 即 按时 间 片 的 
方式 运行 多 个 不 同 终 端的 过 程 (或 线程 )， 执 
行 独立 应 用 逻辑 流 。20 年 以 前 这 种 标准 的 
数据 库 环境 还 是 很 符合 实际 的 ， 但 是 击 在 
大 多 数 商 业 应 用 中 新 的 数据 库 系 统 体系 结 
构 已 经 到 代 了 它们。 出 于 种 种 原因 ， 现 在 
的 太 部 分 系统 中 都 使 用 多 个 CPU 以 并 行 方 
式 提 贷 数据库 服务 。 

本 章 主 要 讨论 一 些 支 持 多 CPU 的 数据 库 系 统 体 系 结构 。 在 这 些 体系 结构 中 ， 有 些 假 设 各 
CPU 承 担 相 同 的 数据 库 服 务 责 任 ， 它 们 往往 物理 上 放 在 一 起 ， 如 在 同一 大 楼 中 ,而 且 相 互 间 
可 以 高 速 通信 ; 妆 一 些 则 假设 CPU 是 地 理 上 分 开 ， 如 可 能 在 不 同 的 城市 ， 并 且 相 互 何 通过 电 
话 线 以 相对 较 慢 的 速度 进行 通 人 入。 物理 上 在 一 起 的 和 多 CPU 系统 一 般 叫 并 行 系统 或 并 行 体系 结 
构 ， 地 理 上 分 开 的 多 CPU 系统 一 般 叫 分 布 式 系 统 。 这 两 种 体系 结构 在 许多 方面 都 有 差别 ， 而 
且 许 多 数据 库 操 作 的 基本 慨 念 都 要 依赖 于 这 些 体 系 结构 的 差别 。 对 所 有 不同 的 体系 结构 进行 
过 论 已 经 超出 了 本 书 的 范围 。 在 以 下 几 节 中 只 简单 介绍 一 些 最 基本 的 概念 ， 并 列 出 -- 些 更 深 
人 处 理 这 些 体 系 结构 的 参考 资料 。 


11.1 多 CPU 体系 结构 


本 节 将 描述 三 种 多 CPU 数 据 库 体系 结构 ， 在 这 些 体系 结构 中 各 CPU 提 供 相同 的 数据 库 服 
务 ; 并 且 描 述 -一 种 称 为 客户 机 -服务 器 结构 ， 在 这 种 体系 结构 中 各 CPU 承担 不 同 的 职责 。 新 的 
系统 类 型 正在 不 断 弛 出 现 ， 而 且 这 里 所 描述 的 也 并 不 全 面 ,但 是 讲述 了 大 多 数 最 基本 的 原理 。 

正如 前 面 所 说 ， 具 有 并 行 体系 结构 的 数据 库 系统 是 多 个 物理 上 连 在 一 起 的 CPU， 而 分 布 式 
系统 是 才 个 地 理 上 分 开 的 CPU。 这 两 种 体系 结构 其 实 都 是 为 了 满足 不 同 的 需要 。 并 行 系统 主 
要 是 为 了 构造 一 个 既 快 又 靡 价 的 集中 式 计算 机 ， 同 时 及 可 以 避免 使 用 -个 高 速 CPU。 正 如 在 
下 一 节 中 看 到 的 ， 用 多 个 低档 CPU 来 代 蔡 一 个 高 档 CPU 会 更 经 济 ` 些 。 另 一 方面 ， 分 布 式 系统 
是 为 了 提供 在 地 理 上 分 开 的 部 门 (如 大 公司 的 子 部 门 ) 提供 局 部 数据 库 日 治 的 能 力 。 分 布 式 
数据 库 方法 使 不 同 的 分 布 式 系统 之 间 的 通信 成 为 可 能 ， 这 样 数据 在 不 同 地 理 位 置 的 机 器 上 可 
以 进行 有 效 地 访问 。 这 里 将 从 并 行 体 系 结构 中 的 紧密 耦 台 的 CPU 开始 ， 进 一 步 介 绍 松散 耦 台 


的 分 布 式 系统 。 
第 一 个 并 行 数据 库 系统 类 型 是 共享 内 存 式 多 处 理 器 ， 它 就 是 一 个 计算 机 上 同时 有 多 个 活 





图 11-1 单 CPFU 数 据 库 系统 体系 结构 
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动 的 CPU 并 且 它 们 共享 单个 内 存 和 一 个 公 
共 磁 盘 接 口 。 共 盏 内 存 式 处 理 器 体系 结构 
的 模 世 图 如 图 11-2 所 示 。 这 种 并 行 体系 结 
构 最 接近 传统 的 单 CPU 处 理 髓 结构 ， 其 设 
计 主 要 挑战 是 用 N 个 CPU 米 得 到 N 倍 单 CPU 
的 性 能 。 但 是 ， 因 为 不 同 的 CPU 对 公共 内 
存 的 访问 是 平等 的 ， 这样 就 可 能 一 个 CPU 
正在 访问 的 数据 被 另 一 个 CPU 人 艇 改 ， 所 以 
这 种 设计 要 有 一 些 特殊 的 处 理 。 然 而 由 于 
内 存 访 问 傈 用 的 是 一 种 商 速 机 制 ， 这 种 机 制 很 难 在 进行 内 存 划 分 时 不 损失 效 挛 ， 所 以 这 些 共 
享 内 存 访 问 的 问题 会 随 着 CPU 个 数 的 增加 而 变 得 更 加 难以 解决 。 日 前 最 大 的 IBM OS/390 也 只 
有 12 个 并 行 CPU ( 男 一 种 称 为 大 规模 并 行 体系 结 板 ， 它 允许 有 几 百 个 CPU 同 时 访问 公共 内 存 ， 
但 需要 -一些 特 殊 的 设计 ， 这 里 就 不 介绍 了 )。 

第 二 种 系统 类 型 是 无 共享 式 并 行 体 系 结 构 ， 也 就 是 说 一 个 计算 机 上 同时 有 多 个 活动 的 
CPU 并 且 它 们 都 有 目 己 的 内 存 和 和 磁盘。 在 不 产生 混 请 的 情况 下 ， 也 称 它 为 并 行 数 据 库 系统 ， 
各 个 涵 担 数据 库 服 务 责任 的 CPU 划 分 它们 自身 数据 ， 并且 通过 划分 任务 以 及 通过 每 秒 兆 位 级 
的 高 速 网 络 通信 完成 事务 和 查询 。 在 图 11-3 中 这 些 高 速 网 络 用 粗 线 表示 ， 用 来 联接 各 系统 节 
点 (简称 节点 }。 这 种 高 速 网 络 规模 的 大 小 是 有 限 的 ， 这 就 要 求 并 行 体系 结构 具有 物理 上 在 一 起 
的 CPU。 这 种 网 络 也 就 是 通常 所 说 的 局 域 网 ， 即 LAN，。 





图 11-2 共享 内 存 式 包 处 理 絮 体系 结构 





图 11-3 并 行 充 共 享 式 体系 结构 


第 三 种 系统 类 型 是 分 布 式 数据 库 系 统 ， 由 于 内 存 不 能 仁 相 隔 很 近 的 CPU 之 间 进 行 共 至 ， 
所 以 这 也 是 一 种 无 共享 型 结构 。 同 样 ， 系 统 数 据 库 也 是 划分 竹 不 同 的 自治 站 点 上 ， 这 样 就 要 
求 查询 和 其 他 数据 操作 语句 能 在 不 同 的 站 点 上 独立 地 执行 ， 并 且 部 分 结果 可 能 需要 在 一 些 相 
关 的 CPU 之 间 进 行 通 信 。 人 和 但是， 在 不 同城 市 的 CPU 之 间 的 通信 与 每 秒 兆 位 级 的 网 络 相 比 是 很 
慢 的 。 在 图 11-4 中 各 CPU 之 间 的 联系 用 细 线 表示 。 与 图 11-3 对 比 ,， 可 以 发 现 除 了 这 个 差别 以 外 ， 
它们 是 完全 相同 的 。 

并 行 数 据 库 系 统 往往 是 从 无 到 有 提供 最 好 的 性 能 价格 比 ， 并 且 各 个 站 点 可 能 都 采用 统一 
的 体系 结构 。 而 另 一 方面 ， 分 布 式 数据 库 系 统 则 往往 是 把 以 前 在 不 同 场所 已 存在 的 系统 联系 
起 来 ， 结 果 ， 在 不 同 站 点 的 机 器 往往 是 异 构 的 ， 宙 有 各 自 不 同 的 迟 系 结构 ， 如 一 个 站 反 上 可 
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能 是 Sun Solaris UNIX 系 统 上 的 ORACLE 系 统 ， 另 一 个 站 点 上 可 能 是 OS/390 机 上 的 DB2 系 统 ， 
第 三 个 站 点 可 能 是 NT 机 上 的 Microsoft SQL 服 务 器 。 这 些 机 器 往往 有 不 同 数 据 表示 的 数 制 (如 
浮 点 数 )， 也 可 能 有 不 同 的 SQL 语 法 【在 不 同 站 点 之 间 的 查询 通信 和 要 使 用 通用 的 X/Open 请 法 )。 
在 并 行 系统 中 不 同 站 点 机 器 的 合作 可 道 过 数据 库 系 统 的 事务 管理 器 模块 来 实现 ， 但 在 混合 了 
带 有 不 同 数据 库 系统 的 异 构 站 点 的 体系 结构 中 这 一 般 是 不 可 能 的 。 正 是 出 于 这 个 原因 ， 出 现 
了 一 种 叫 TP 监 视 器 的 软件 来 连接 这 些 站 点 。TP 监 视 器 在 不 闻 站 点 的 单独 数据 库 之 上 ， 并 使 用 
它们 来 提供 局 部 所 需 的 服务 。TP 监 视 器 提供 线程 来 运行 用 户 程 序 和 远程 过 程 调 用 来 实现 对 远 
端 站 点 的 请 求 调用 。 在 这 种 调用 的 通信 参数 中 监视 器 提供 了 所 需 的 数据 表示 的 转换 。TP 监 视 
器 是 一 个 非常 复杂 的 系统 ， 已 经 超出 了 本 书 讨论 的 范围 ， 话 细 内 容 可 以 参考 Gray 和 Renuter 所 
写 的 文章 (推荐 读物 [5])。 





图 11-4 分 布 式 《 无 共享 ) 体系 结构 


在 图 11-2、11-3、11-4 中 ， 所 有 的 CPU 对 系统 提 变 的 数据 库 服 务 际 担 相同 前 责任 。 在 无 共 
享 式 体系 结构 下 ， 数 据 被 划分 在 不 同 站 点 的 磁盘 上 ， 引 用 了 多 个 站 点 数据 的 查询 再 要 这 些 
CPU 之 间 的 相互 合作 ， 并 把 结果 返回 给 输入 查询 的 用 户 终 端 。 显然 这 些 体 系 结 构 都 对 数据 库 
设计 有 很 重要 的 含义 。 妆 数据 库 中 的 表 划 分 在 不 同城 市 间 的 磁盘 上 时 如 何 进行 查询 优化 ? 当 
一 个 CPU 不 能 在 -- -个 更 新 事务 中 更 新 它 所 控制 的 数据 时 整个 事务 该 怎么 办 ”数据 库 实 现 痢 们 
正 对 这 些 重要 问题 进行 不 断 的 探索 。 

客户 机 -服务 器 体系 结构 

如 斤 11-2 和 11-3 所 示 ， 并 行 体系 结构 的 动机 是 用 多 个 小 的 CPU 来 取代 :一 个 大 的 CPU， 这 样 
可 以 更 经 济 一 些 。 但 是 对 这 种 所 有 CPU 承担 相同 职责 的 结构 来 说 ， 还 存在 另 一 种 体系 结构 类 
型 可 以 选择 。 使 用 客户 机 -服务 器 体系 结构 ， 小 的 客户 机 CPU (往往 是 PC 机 ) 只 要 负责 与 用 
户 变 互 功能 、 提 供 数据 表示 功能 和 决定 需要 回答 用 户 请 求 的 数据 客户 机 可 以 在 本 地 磁 研 上 
没有 用 户 所 需 的 大 部 分 数据 , 它 只 要 向 集中 式 服务 器 发 送 高 层 数 据 请 求 (SQL 级 请 求 或 程序 
的 远 端 过 程 调用 ) 就 可 以 了 ， 而 服务 器 一 般 为 共享 内 存 式 多 处 理 器 。 客 户 机 也 可 能 与 更 复杂 
的 并 行 服务 器 或 甚至 与 多 个 服务 器 打交道 。 客 户 机 -服务 器 系统 的 主要 特点 是 客户 机 CPU 与 服 
务 器 CPU 之 间 的 职责 的 划分 ， 客 户 机 CPU 主 卓 人 负责 数 据 表 示 服 务 ， 而 服务 器 CPU 主 要 人 负责 
据 库 服务 《如 图 11-$ )。 
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图 11-5 客户 机 -服务 器 体系 结构 


11.2 CPU 价格 与 性 能 曲线 


前 而已 经 担 到 过 图 11-2 和 11-3 所 示 的 并 行 数据 库 结构 主要 是 为 了 获得 更 高 的 性 能 价格 比 。 
现在 就 这 一 点 展开 详细 讨论 。 

用 指定 CPU 的 $COST 来 表示 购买 一 个 CPU 所 花费 的 批发 价 。 要 注意 的 是 大 多 数 超过 $1000 
的 PC 机 ， 它 们 的 CPU 往 往 低 于 $100;， 其 余 的 开销 主要 花 在 磁盘 、 软 件 等 方面 。CPU 的 性 能 可 
用 每 秒 百 万 条 指令 来 表示 ， 也 可 简 记 为 MIPS。 但是， 因为 CPU 可 以 完成 许多 种 工作 【科学 计 
算 、 图 形 显示 、 各 种 不 同类 型 的 商用 数据 库 应 用 程序 )， 所 以 这 种 评定 CPU 性 能 的 方法 是 有 问 
古 的 。 这 就 要 求 基准 测试 程序 要 能 准确 地 测量 出 各 各 情况。 一旦 基 淮 测试 程序 确定 以 后 ， 化 
们 就 成 为 供应 商 们 所 追求 的 性 能 月 标 了 。 对 某 些 著名 的 基准 测试 程序 ， 计 算 机 设计 者 采取 了 
特殊 操作 和 编译 调整 以 在 基准 测试 程序 中 达到 更 高 的 性 能 。 在 许多 情况 下 ， 在 基准 测试 程序 
逻辑 上 做 一 很 小 的 调整 会 引起 许多 指标 急剧 下 降 。 网 样 在 很 多 情况 下 ， 人 们 街 量 机 器 性 能 的 
指标 与 出 售 计算 机 的 广 商 一 样 ， 这 样 在 性 能 评估 上 就 有 可 能 会 有 一 些 偏差 。 因 此 ， 一 般 
S0MIPS 的 PC 机 往往 要 在 性 能 上 大 大 低 于 IBM 大 型 机 的 50MIPS 计 算 机 ， 也 正 因 为 二 面 所 提 到 
的 这 些 困 难 ，IBM 在 其 他 产品 上 有 时 并 不 支持 MIPS 指 标 。 

由 于 大 家 都 喜欢 一 个 简单 的 答案 ， 因 
此 下 面 给 出 不 同 CPU 的 MIPS 值 。 这 个 MIPS 
值 用 来 反映 在 所 有 数据 库 系 统 应 用 程序 中 
CPU 的 性 能 。 那 么 在 今后 大 约 15 年 中 计算 
机 体系 结构 的 曲线 将 如 图 11-6 所 示 ， 它 表 
乐 价格 与 性 能 之 癌 的 关系 。 图 11-6 中 其 体 
的 数字 不 一 定 准 确 《〈《 因 为 CPU 价格 和 技术 
一 直 在 变化 ，， 但 太 体 形状 是 正确 的 。 





从 图 11-6 中 可 以 看 出 $COST 与 性 能 的 性 能 
关系 是 超 线性 的 。 这 也 就 是 说 ， 如 果 单 个 50 MIPS 1000 MIPS 
S50MIPS 的 CPU 人 价格 为 $100， 弄 单个 图 11-6 CPU 的 价格 与 性 能 的 关系 


100MIPS 的 CPU 的 价格 就 要 超过 $200 了 。 
目前 ， 一 个 20 悦 50MIPS CPU 性 能 的 1000MIPS CPU 要 $10 000 000， 是 一 个 50MIPS CPU 价格 
的 10 000 倍 。 这 主要 是 因为 CPU 速 度 越 高 ， 则 越 接 近 这 项 技术 的 上 限 ， 就 不 得 不 为 采取 浊 多 
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的 复杂 技术 来 实现 的 更 快速 度 付 更 多 的 钱 。 就 像 要 寄 一 封 信 到 欧洲 ， 可 以 寄 普 通信 件 很 便宜 
但 需要 2 天 ; 也 亲 以 派 专人 乘 飞 机 直接 送 过 去 ， 这 当然 很 快 ， 但 花费 也 要 大 得 多 ， 

数据 库 行 业 中 的 规律 是 什么 ? 非常 简单 : 多 个 小 的 CPU 比 一 个 大 的 CPU 更 经 济 。 奶 宁 一 
商业 公司 拥有 一 个 老式 体系 绍 构 的 主机 ， 而 它 的 大 部 分 时 间 主 要 花 在 为 一 组 终 妆 用 户 提 供 交 
互 服务 的 分 时 模式 上 ， 则 该 公司 可 以 为 每 个 终端 用 户 买 一 台 PC 机 以 提供 其 所 需 的 交互 服务 ， 
然后 把 所 有 PC 机 作为 客户 机 连结 到 一 个 集中 式 服务 器 上 ， 又 因为 这 个 集中 式 服务 器 不 需 为 许 
多 终端 做 大 基 的 数据 表示 服务 ， 所 以 容量 较 小 的 计算 机 就 可 以 胜任 。 在 这 种 设计 中 ， 服 务 器 
只 要 去 访问 在 大 量 磁 岳 中 的 数据 并 给 用 户 返 回 简单 结果 就 可 以 很 好 地 做 大 容量 机 器 所 做 的 工 
作 。 可 以 从 图 11-6 中 看 出 价格 /性 能 曲线 促使 企业 采用 客户 机 -服务 器 体系 结构 。 确 实 ， 所 有 以 
前 提 到 过 的 各 种 多 CPU 数据 库 体 系 结构 都 说 明 : 应 该 学 会 如 何 用 儿 个 小 的 CPU 来 完成 一 个 大 
的 CPU 的 工作 。 

并 行 处 理 某 项 自然 可 分 的 工作 是 很 简单 的 。 比 如 一 组 技术 大 员 进行 文档 处 理 ， 他 们 除了 
把 打印 好 的 文本 给 别人 检查 以 外 无 需 进 行 额外 的 相互 通信 。 在 这 种 情况 下 ， 一 个 合理 的 解决 
方法 是 给 所 有 用 户 配置 PC 机 和 一 些 单 用 户 的 字 处 理 软 件 。 这 种 工作 环境 就 可 以 取得 所 硕 望 的 
并 行 性 ， 而 义 无 需 用 一 个 高 档 的 分 时 计算 机 进行 字 处 理 。 这 样 做 往往 更 经 济 一 些 。 

但 是 一 些 数据 库 应 用 程序 中 需要 大 其 的 相互 间 通 信 ， 这 使 应 用 程序 在 一 组 不 同 CPU 上 运 
行 的 必要 性 不 是 很 明显 ， 这 些 CPU 通 过 … 个 高 速 网 络 通 信和 时 ,更 是 如 此 , 一 个 好 的 思路 是 近 
人 支持 数据 库 应 用 程序 的 系统 体系 结构 中 ， 不 考虑 这 些 应 用 程序 的 通信 开销 可 能 会 抵消 使 用 
小 的 CPU 所 节省 的 花 销 。 此 外 ， 一 个 数据 库 系 统 在 数据 访问 设备 上 投资 往往 较 大 ， 如 磁盘 驱 
动 器 (现在 的 工作 站 系统 花 销 的 50% )， 并且 一 个 粗心 的 存储 方法 也 会 使 体系 结构 非常 不 经 济 。 
这 样 可 以 看 出 CPU 价格 并 不 是 分 布 式 数据 库 系 统 唯一 的 价格 因素 。 寻 找 最 佳 的 并 行 数 据 库 系 
统 体系 结构 的 研究 一 直 在 持续 ， 在 后 面 章节 中 会 对 出 现 的 问题 进行 一 些 讨论 。 


11.3 无 共享 式 数据 库 体 系 结构 


图 11-3 和 11-4 中 的 无 共享 式 数 据 库 体系 结构 的 一 般 概 念 如 下 所 述 。 考 虑 到 性 能 优 格 比 或 地 
理 分 布 ， 把 所 有 的 数据 库 服务 放 在 一 台大 型 计算 机 上 往往 是 不 可 行 的 ， 因 此 往往 把 数据 分 开 
放 在 许多 不 同 的 带 有 独立 内 容 的 低 成 本 计算 机 上 。 这 些 不 同 的 系统 { 称 其 为 站 点 或 站 点 机 器 ) 
必须 能 相互 合作 进行 数据 库 操作 ， 这 就 要 求 站 点 之 间 必 须 能 进行 相互 通信 

例 11.3.1 ”TPC-A 基 准 测 试 程序 。10.10 节 中 的 TPC-A 基 准 测 试 程序 没有 提 到 在 多 CPU 无 
共享 式 数据 库 系 统 环 境 下 应 用 这 种 基准 测试 程序 的 可 能 性 。 但 是 ， 该 基准 测试 程序 的 设计 者 
早 就 预见 到 这 一 点 ， 采 取 某 些 规则 就 可 以 确保 这 项 测试 是 现实 的 。 要 在 无 共享 式 系 统 中 运行 
TPC-A, 需要 把 数据 分 开放 到 多 个 机 器 上 。 假设 有 10 人 台 站 点 计算 机 并 用 100-TPS 指 标 进行 测试 ， 
则 在 Branch 表 中 有 100 行 。 此 外 每 一 出 纳 员 和 账户 (Telier 和 Account 表 中 的 行 ) 都 与 一 
个 特定 的 部 门 有 关系 ， 设 和 舞 一 个 部 门 有 10 个 出纳 员 和 100 000 个 账户 。 为 了 用 分 布 式 数据 库 系 
统 中 的 每 个 站 点 机 器 来 支持 TPC-A 中 工作 量 ， 需 要 将 表 在 10 个 站 点 中 进行 均 分 。 标 准 做 法 是 
每 个 站 点 都 有 自己 的 Branch、Teller 和 Account 表 ， 则 每 个 站 点 上 的 Branch 表 中 具有 10 
行 〈( 因 为 Branch 表 的 100 行 在 10 个 站 点 上 进行 了 划分 )。Telier 和 Account 肖 也 在 10 个 站 
点 上 进行 了 划分 ， 并存 人 相应 的 站 点 中 。 

现在 简单 描述 一 下 TPC- 和 的 事务 人 逻辑， 每 一 事务 代表 一 个 账户 特有 者 ‘(Aid ) 去 某 个 银行 
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部 门 (Bia) 的 某 个 出 纳 员 (Tia) (随机 的 ) 处 从 自己 的 存款 账户 中 取款 “Delta )， 此 次 
提 款 同样 也 反映 在 Branch 表 和 Te11ler 表 中。 是 理 需 要 在 站 点 之 闻 进 行 通信 呢 ? 如 果 账 户 持 
有 者 在 本 地 银行 部 门 提 款 ， 则 无 需 访 癌 其 他 站 点 的 数据 。 恒 是 还 存在 其 他 的 可 能 性 随机 地 
产生 【aid,Tia,Bid 和 Delta) 信息 ， 其 中 85 久 表示 Aia 属 于 本 地 的 Bijd 中 ， 但 是 这 些 信息 
的 另外 15 免 可 能 性 是 Aia 属 于 外 地 的 部 1 门 。 这 种 情况 显然 需要 进行 通信 ， 由 于 每 个 站 点 有 10 个 
部 门 ， 大 约 有 90 免 需要 与 其 他 的 站 上 总 进行 通信 。 要 注意 的 是 事务 需 昌 给 本 地 站 点 Branmnech 账 目 
和 本 地 站 点 Tel1ler 账 目 如 上 Delta， 同 时 在 account 账 目 上 也 要 加 上 Deltae 这 了 就 暗示 更 
新 不 同 站 点 上 的 Account 表 是 更 新 本 地 的 Branch 表 和 Tel1ler 表 事务 的 一 部 分 。 显 然 ， 这 就 
意味 着 我 们 需要 重新 观察 ACID 特性 ， 以 确保 分 布 式 事 务 被 正确 处 理 。 | 


首先 例 11.3.1 中 通信 开销 不 是 很 严重 ， 似 乎 只 要 在 15 名 时 间 中 发 一 个 消息 并 在 处 地 站 点 上 
做 一 下 更 新 就 可 以 了 。 间 题 是 在 一 个 事务 中 要 更 新 的 不 同行 出 现在 不 同 的 内 存 中 ， 识 不 同 的 
处 理 器 加 锁 ， 因 此 也 不 能 像 传统 集中 式 数据 库 体 系 结构 中 那样 同步 事务 担 交 。 假 设 需要 局 动 
另 一 站 点 上 的 一 个 事务 做 一 更 新 ， 然 后 两 个 事务 协 风 提交 。 虽 然 从 整体 上 来 讲 它 似乎 是 一 个 
非常 简单 的 要 求 ， 但 是 实际 上 它 是 一 个 非常 不 明确 的 要 求 。 进一步 研 究 就 会 发 现在 执行 分 布 
式 事务 时 会 出 现 放 多 复杂 的 问题 。 下 面 几 小 节 对 其 中 几 个 问题 进行 探讨 。 

1. 两 阶段 提交 

现在 考察 前 面 担 到 的 情况 : 一 个 本 地 事务 突然 访问 远 地 靖 点 的 数据 而 需要 启动 异地 男 一 
事务 。 比 如 ， 在 无 共享 式 系统 中 的 TPC-A 中 考虑 如 下 情况 : 一 个 账 导 持 有 者 在 站点 2 上 访问 站 
点 I 的 银行 部 门 信息 。 从 图 10-17 的 事务 逻辑 中 我 们 可 以 看 出 第 一 个 数据 访问 是 在 站 点 2， 而 册 
纳 员 与 终端 的 冯 互 是 在 站 点 1。 因 此 分 布 式 事务 To 在 站 点 1 上 初始 化 并 协同 运行 ， 而 本 弛 事务 
T: 则 运行 在 站 点 2 上 。 第 二 次 去 访问 History 表 是 在 站 点 1 的 本 地 机 器 上 ， 因 此 分 布 式 事务 Tu, 现 
在 也 在 站 点 1 上 有 一 本 地 事务 T。 当 TPC-A 事 务 逻 辑 宴 记 时 ， 为 成 功 完 成 分 布 式 事务 T,， 事 务 
T, 和 T, 必 须 协同 提交 。 

在 大 多 数 带 有 异 构 姑 点 的 无 共享 式 数 据 库 系统 中 ， 访 问 远程 数据 对 应 用 程序 来 说 是 透明 
的 ， 它 往往 由 数据 库 系 统 的 事务 管理 器 {TM ) 来 提供 ， 它 具有 在 不 同 站 点 机 器 上 如 何 划 分 数 
据 库 的 全 局 图 。 参 见 图 10-8 以 及 其 后 的 有 关 TM 的 语义 会 多 和 它 在 事务 系统 中 地 位 的 讨论 。 在 
无 共享 式 体 系 结 构 中 ， TM 决定 哪个 站 点 启动 本 地 事务 、 推 进 访问 和 操作 合适 站 点 的 数据 的 进 
度 程序 和 等 待 回答 ， 并 负责 分 布 式 事务 提交 。 当 TM 最 后 决定 提交 ( 或 回 退 ) 时 ,事务 可 能 已 
经 读 取 或 更 新 几 个 不 同 站 点 上 的 不 同 数据 项 目 {TPC-A 事 务 太 简单 了 以 至 于 涉及 到 多 于 两 个 
站 点 的 情况 )。 

如 果 分 布 式 事务 的 各 站 点 事务 都 能 保证 一 起 提交 或 终止 ， 则 称 它 们 是 协同 的 。 假 定 相互 
协同 条 仁 ， 分 布 式 事务 就 可 以 从 各 站 点 事务 继承 ACID 特性 。 如 果 分 布 式 事务 在 任何 时 候 访 问 
任意 站 点 上 的 数据 都 采用 了 注 阶 段 加 锁 ， 则 可 以 实现 作为 包 访 问 的 分 布 数据 的 隔离 ( 加 锁定 
理 10.4.2 在 分 布 式 事务 中 仍然 成 立 )。 正 如 前 面 所 说 的 ,隔离 性 就 意味 首 一 致 性 。 只 要 提 到 
ACID 性 质 中 的 持久 性 时 ， 就 要 考虑 一 个 站 点 月 演 时 会 发 生 什 么 样 的 情况 。--- 个 已 提交 的 分 布 
式 事务 会 在 所 有 本 地 站 点 中 写 人 提交 日 志 (要 记 住 现在 假设 所 有 和 参加 的 站 点 囊 务 都 一 起 提交 
或 中 止 ), 因此 当前 省 站 点 恢复 以 后 ， 系 统 可 以 进行 重 做 恢复 。 当 然 一 个 站 点 可 能 会 多 次 骨 演 ， 
这 就 需要 一 些 新 的 恢复 方法 来 处 理 分 布 式 事务 的 焦 复 ， 但 这 并 不 难 ， 

这 其 中 有 一 个 关键 的 假设 分 布 式 事务 的 所 有 站 点 事务 都 可 以 是 协 间 的 ， 即 可 以 一 起 全 
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部 提交 或 中 止 。 这 也 就 保证 了 分 布 式 事务 的 原子 性 ， 即 事务 的 更 新 要 人 么 全 执行 要 委 全 不 执行 。 
但 是 目前 所 遇 到 的 本 地 事务 类 型 都 不 能 协同 不 同 站 点 的 事务 ， 即 所 谓 的 基本 事务 行为 。 正 如 
我 们 已 经 描述 的 ， 一 个 由 调度 程序 初始 化 的 基本 事务 只 有 三 个 状态 ， 事 务 只 能 以 这 二 种 状态 
存在 ， 如 下 所 述 ， 

激活 ( Active ) 态 ” 当 革 一 在 序 访 问 数据 时 ， 作 为 响应 、 调 度 程序 就 会 启动 一 个 事务 ， 从 

向 使 事务 进 人 激活 态 . 一 个 各 务 可 以 从 激活 态 转变 刘 提 交 态 或 中 小 态 。 

在 系统 月 汝 及 其 后 的 恢复 事件 中 事务 就 会 从 激活 态 进 入 到 中 止 态 中 。 

提交 【Committed ) 守 应 用 线程 提交 请 求 的 结果 是 激活 态 的 事务 进 人 提交 态 。 没 有 离开 
提交 坊 的 边 。 

中 止 [Aborted ) 态 应 用 线程 请 求 回 退 或 因为 系统 的 其 他 原因 (如 事务 死 锁 或 系统 般 溃 和 

恢复 ) 都 会 导致 事务 由 激活 态 进 人 中 正 态 。 也 设 有 离开 中 赴 态 的 边 。 

图 11-7 给 出 了 基本 事务 状态 和 它们 之 间 可 能 的 
事务 转化 。 要 注意 的 是 虽然 激活 态 事务 可 以 转换 到 
提交 态 或 中 止 态 ， 但 是 一 巨 它 进入 任何 一 种 状态 就 
不 能 再 改变 了 。 妆 一 个 事务 提交 后 ， 它 没有 能 力 恢 
复 在 数 活 态 所 做 的 数据 更 新 了 。 这 是 因为 提交 以 后 
就 会 释放 锁 ， 这 样 其 他 事务 就 可 以 看 到 所 做 的 数据 
更 新 。 设 有 了 隅 离 性 ， 就 再 也 不 能 进行 回 退 了 。 司 图 11-7 基本 事务 状态 转移 图 
桩 ， 出 于 某 个 原因 而 引起 的 中 止 也 会 导致 锁 的 释放 。 最 后 很 重要 的 … 点 是 系统 不 能 保证 任何 
其 他 站 点 事务 都 会 进 人 提交 态 。 如 果 基 汕 活 态 事务 的 站 点 前 总 了 ， 即 使 昆 马 上 恢复 ， 激 活 态 
事务 也 会 对 它 所 做 的 更 新 进行 UNDO 操 作 ， 并 进入 中 止 态 。 这 种 情况 下 进入 中 目 态 的 主要 原 
因 是 系统 一 般 本 能 恢复 足够 的 上 下 文 来 继续 成 功 提交 的 事务 。 只 有 原始 的 应 用 程序 才 可 以 通 
过 重 做 【Redo ) 做 到 这 一 点 。 最 后 要 注意 的 是 在 我 们 的 模型 中 没有 保证 避免 在 给 定 站 点 的 朋 
涡 。 

基本 各 务 的 特性 组 合 使 事务 间 的 协同 几乎 是 不 可 能 的 。 为 了 说 明 这 一 点 ， 想 定 启 动 不 同 
站 点 上 的 两 个 基本 事务 ,来 完成 例 11.3.1 的 分 布 式 TPC-A 人 逻辑 。 记 TT 为 本 地 部 门 站 点 1 的 事务 ， 
在 这 里 给 Branch 和 Teller 巍 月 如 上 Delta，T, 汐 远 咒 事务， 那里 尝 给 外 地 部 门 站 点 2 的 三 
户 账 目 加 上 Delta。 现 在 假设 站 点 1 上 的 事务 管理 器 充当 协调 程序 ， 从 而 调度 两 个 事务 以 便 它 们 
都 提交 或 中 止 。 协 调 程序 会 如 何 工作 呢 ? 

对 于 协调 程序 一 种 可 能 的 做 法 是 先 提 交 本 地 事务 T,， 成 功 发 送 一 个 消 朋 来 提交 和 远 端 事务 
T;。 人 和 但 是 如 果 在 收 到 这 一 消息 时 站 点 2 大 下 ， 则 在 恢复 时 会 中 止 事务 T:。 图 11-8 演 示 了 这 一 系 
列 事件 。 

在 站 点 2 恢复 之 后 ， 提 变 T2 的 请 求 不 成 功 ， 因 为 T; 已 经 进入 了 中 止 态 。 由 于 T, 已 经 提 区 而 
T: 中 止 掉 ， 所 以 银行 记录 中 的 钱 就 会 损失 掉 ( 因为 钱 已 经 通过 T 从 部 门 和 出 纳 员 那 取 出 但 通过 
T: 并 没有 加 人 到 持 有 者 账号 上 )。 

协调 程序 第 一 种 可 能 的 做 法 是 先 给 站 点 2 发 一 个 消息 来 提交 事务 T:， 在 收 钊 成 切 返 回信 息 
时 ， 再 提交 T,。 这 种 方法 也 会 出 错 。 在 站 点 2 提交 可 能 会 成 功 ， 但 是 站 点 1 可 能 会 在 收 到 成 功 
返回 信息 前 就 崩 当 了 。 在 恢复 之 后 ,TT 中 止 了 而 T, 提 交 了， 导致 外 地 部 门 账号 赚 昌 已 经 版 出 南 
本 地 部 门 和 出 纳 员 的 赚 目 却 没 有 任何 变化 (假设 账号 持 有 者 没收 到 任何 现金 )}、 最 后 协调 程序 
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可 能 会 不 等 待 成 功 信息 就 尝试 同时 提交 T 和 T:， 但 是 显然 还 是 有 可 能 两 个 事务 中 的 一 个 提交 成 
功 而 为 一 个 因 崩 滥 而 进 和 人 中止 态 。 


T, 和 T; 准 备 提 交 T, 山 淄 并 进行 恢复 
T 的 状态 为 提交 坊 。 工 ,的 状态 为 中 止 坊 





图 11-8 分 布 忒 事务 失败 的 协调 程序 


对 分 布 式 事务 中 的 任意 一 个 站 点 都 没有 办 法 确定 它 会 在 什么 时 候 崩 泪 。 协 调 程序 所 面临 
的 主要 问题 是 : 一 个 站 点 的 事务 中 止 而 另 一 个 成 功 提 变 了 ， 都 进入 了 不 可 能 转移 的 状态 ， 而 
这 些 状 态 又 是 相互 冲突 的 。 目 前 情况 下 进 人 中 止 态 的 主要 原 困 是 活动 事务 的 站 点 般 总 了， 在 
系统 恢复 时 事务 就 进入 了 中 目 态 。 现 在 引信 准备 请 求 使 站 点 事务 可 以 进入 被 称 为 准备 态 的 状 
态 。 玲 备 请 求 可 以 由 协调 程序 产生 。 准 备 态 的 定义 如 下 : 

准备 【 Prepared } 态 分 布 式 事务 协调 程序 发 出 一 个 准备 请 求 以 后 事务 就 会 进 人 准备 态 。 

事务 可 以 从 准备 态 进 入 所 交 态 或 中 止 态 。 在 忆 泪 及 其 后 的 恢复 中 ， 
准备 态 的 事务 还 会 返回 叭 备 态 。 

当 一 个 站 点 的 活动 事务 收 到 准备 请 求 时 ， 它 就 会 把 当前 活动 事务 的 状态 保存 下 来 。 注 意 ， 
在 开始 准备 之 前 事务 要 做 的 所 有 动作 都 已 经 做 完 。 现 在 把 准备 日 志 写 人 口 志 缓 冲 区 中 ， 并 把 
日 志 缓 冲 区 的 内 容 写 人 到 日 志文 件 中 。 做 完 这 
些 以 后 我 们 就 称 事 务 进 人 了 准备 态 。 在 发 生 
崩溃 并 进行 相应 恢复 中 ， 事务 的 当前 状态 可 以 
重建 。 从 恢复 的 准备 态 仍然 可 以 进行 提交 或 中 
止 操作 ( 见 图 11-9 )。 为 了 维护 这 种 灵活 性 ， 
在 站 点 崩 澳 以 后 ， 需 要 重 做 事务 的 所 有 更 新 并 
要 维护 完成 恢复 以 后 在 写 人 日 志文 件 之 前 的 全 图 11-9 带 准 备 态 的 状态 转移 图 
部 信息 。 在 恢复 以 后 也 要 重建 活动 事务 保持 的 
所 有 数据 项 的 锁 。 

有 J 了 新 的 准备 状态 ， 分布 式 事务 协调 程序 就 可 以 克服 参加 站 点 的 不 可 预见 的 中 止 问 题 。 
在 分 布 式 TPC-A 事 务 【 记 为 Th ) 的 例子 中 ， 站 点 1 事务 为 T,， 站 点 2 事务 为 T,， 站 点 1 的 协调 程 
序 可 以 呈 成 如 图 11-10 所 示 的 人 逮 辑 。 这 种 方法 就 称 两 阶段 提交 (2PC ) 协议 ， 这 是 一 种 商业 数 
据 库 系统 实现 分 布 式 事务 协同 提交 的 标准 方法 。 请 注意 图 11-10 中 PREPARE (TT,) 可 能 出 于 种 
种 原因 而 会 失败 。 站 点 上 的 事务 也 可 能 由 于 某 种 原因 而 中 止 ， 如 为 了 打破 死 锁 ， 并 贞 由 站 点 2 
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返回 林 成 功 消息 。 此 外 站 点 还 可 能 毅 泪 或 与 网 络 断 开 连 接 ， 这 些 问 题 可 以 与 返回 不 成 功 信息 
一 样 看 待 。 在 上 述 任 一 ' 状 态 下 假设 T; 会 中 止 。 由 于 恢复 可 能 会 中 止 话 动 事 务 ， 显 然 如 果 系 统 
衣 活 ， 这 是 很 合适 的 原因 。 如 凡 网 络 发 生 失 效 ， 则 超时 以 后 融会 中 止 事务 。 另 一 方面 ， 如 采 
在 站 点 或 网 络 撩 效 之 前 准备 请 求 到 达 了 站 点 2， 则 可 以 有 一 个 更 持久 的 状态 。 由 于 协调 程序 设 
有 收 到 啊 应 ， 则 它 会 中 小 T， 并 把 aBORT T, 号 人 到 本地 日 志文 件 中 ， 并 给 站 点 2 发 送 相应 的 
消息 。 想 设 站 点 2 恢复 以 后 可 以 收 到 这 个 消息 ， 则 它 就 会 中 止 T,， 它 是 T, 的 一 部 分 。 


BEGINY 
REQUEST PREPARECTS } /i* redquires message to site 2 
IF RESPONSE IS “UNSUCCESSFUL™ i Site 2 crashed. network failed 
ROLLBACK T], WRITE “ABORT Th" A* abort distributed transaction 
ELSE IF (Tl is "ACTIVE") zw Tl hasn’t aborted while waiting 


EDOMMITLT1，TD) i* no gotng back now 
REQUEST COMMIT Ta) f 二 will sutceed evaentually 
上 LS i* Tl has aborted 
WRITE "ABORT To” i* abort distributed transaction 
REQUEST ABDRTTS) i MeSSage to site 2 





图 11-10 两 站 点 分 布 式 事务 的 两 阶段 提交 


另 一 方面 ， 如 果 站 点 2 返回 成 功 消 息 ， 则 协调 程序 就 会 将 本 地 事务 T, 和 分 布 式 事务 T, 一 起 
协同 提交 ， 并 写 入 到 日 志文 件 中 。 这 往往 是 一 般 分 布 式 事务 协调 的 弱点 。 在 一 个 节点 提交 成 
功 后 另 一 个 崩 泪 ， 并 且 在 恢复 时 另 一 个 基本 事 券 已 被 中 止 。 但 是 因为 T. 已 经 准备 过 ， 所 以 这 
里 不 会 发 生 这 种 情况 。 如 果 站 点 2 更 泪 ， 则 这 只 意味 着 -- 个 延迟 ， 在 恢复 之 后 T 仍 然 可 以 返回 
准备 状态 。 在 T. 与 T, 提 交 之 后 ， 协 调 程序 会 发 COMMIT 消 息 到 站 点 2 上 ， 在 站 点 2 上 处 理 准 备 
态 的 T. 就 可 以 提交 成 功 。 如 果 在 T, 棍 交 之 后 站 点 1 崩 省 了 ， 人 恢复 之 后 会 给 所 有 相关 的 站 点 重 发 
-个 COMMIT 消 息 ( 重复 消息 没有 害处 六 图 11-11 说 明了 这 一 系列 的 事件 - 

两 阶段 提交 协议 同样 适用 于 多 个 站 点 。 多 个 站 点 的 2PC 协 议 的 杷 架 如 下 所 示 。 

阶段 1: 协调 程序 给 分 布 式 事务 中 相关 的 所 有 站 点 事务 发 准备 请 求 消息 ， 如 果 有 一 个 站 上 后 
返回 “不 成 功 ”， 则 协调 程序 辐 退 本 地 事务 ， 并 发 消息 给 其 他 站 点 中 正事 务 执行 。 

阶段 2， 如 果 所 有 的 准备 请 求 结 果 都 是 “成 功 ”"， 则 协调 程序 提交 分 布 式 事务 T, 科 本 地 事 
务 ， 并 给 其 他 站 点 发 提交 事务 消息 。 这 些 消 息 迟 早 都 会 到 达 的 。 

2. 无 共 享 式 体系 结构 的 进一步 问题 

两 阶段 提交 协议 不 是 很 容易 实现 的 (PB2 在 实现 它 时 就 花 了 好 郧 年 的 时 间 )， 其 中 会 出 现 
许多 难题 ， 现 列举 一 些 如 下 。 

分 布 式 死 锁 “假设 分 布 式 事务 Tu 更 新 站 点 I 上 的 数据 项 A 并 试图 下 新 站 点 2 的 数据 项 B， 但 
是 发 现 B 已 经 被 加 锁 耳 ， 所 以 T,, 进 入 等 符 状 态 。 现 在 假设 在 站 点 2 上 给 数据 项 B 可 锁 的 分 布 式 
事务 为 T。,， 它 也 试图 更 新 站 点 1 上 的 数据 项 A。 显 然 这 是 一 个 死 锁 。 但 是 如 何 检测 这 种 死 锁 
呢 ? 请 回忆 一 下 现在 所 面 对 的 站 点 CPU 是 无 公共 内 存 或 不 知道 外 部 站 点 计算 机 上 加 锁 表 中 的 
任何 数据 项 的 、 没 有 一 个 站 点 可 以 跟踪 涉及 到 见 个 站 点 的 等 待 环 。 这 个 问题 的 最 简单 的 解决 
方法 是 放弃 死 锁 检 测 而 使 用 超时 中 直方 法。 当 分 布 式 事务 在 等 待 外 部 站 点 的 数据 项 时 ， 就 有 
可 能 进入 死 锁 ， 这 样 超 过 特定 时 间 以 后 ， 事 务 中 止 并 重 试 。 很 重要 的 一 点 是 不 同 的 站 点 选用 
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不 同 的 超时 时 间 间 篇 。 这 种 方法 可 以 避免 它们 一 起 放弃 又 同时 重 试 。 


3. 出 壮 / 恢 复 没 有 影响 ，T 都 可 以 回 到 准备 态 +. 协调 程序 置 T, 状态 为 握 交 态 





图 11-11 两 阶段 提交 的 事件 顺序 


事务 阻塞 ”如 果 存 处 理事 务 之 前 必须 等 待 其 从 一 个 长 时 间 失 效 中 恢复 则 称 事务 是 阻塞 的 。 
由 于 阻塞 的 事务 可 能 会 给 大 批 数据 加 锁 ， 所 以 它 会 引起 很 严重 的 问题 。 在 以 下 的 情况 下 两 内 
段 提 交 协 议 就 可 能 引起 死 锁 。 假 设 站 点 1 的 协调 程序 在 给 站 点 2 的 事 笋 发 准备 请 求 以 后 ， 而 在 
发 最 后 的 提交 消息 (或 由 于 某 种 原因 中 修 本 地 事务 而 发 中 站 消 息 ) 以 前 就 月 演 了。 假定 和 任 一 
种 半 果 都 是 可 能 的 ， 正 因为 如 此 站 点 2 的 准备 态 事务 T, 在 这 个 协议 下 就 不 能 上 自己 做 出 选择 。 它 
必须 一 喜 等 到 协调 程序 恢复 以 后 做 出 决定 ,但 是 这 可 能 要 花 不 少 的 时 间 ， 如 果 它 在 
PEPSI 12_OZz 行 上 加 锁 ， 而 如 果 这 数据 可 能 会 在 一 秒 内 被 50 个 订单 所 访问 ， 则 这 样 的 开销 是 
无 法 猴 受 欧 ， 目前 对 此 还 没有 很 好 的 解决 方法 。 另 一 个 叫 三 阶段 提交 协议 的 设计 用 来 在 大 多 
数 情 况 下 避免 事务 阻塞 ， 但 是 为 了 达到 提交 它 涉及 到 另外 -- 条 消息 ， 所 以 目前 它 还 没有 商业 
化 【请 记 作 通信 的 开销 会 抵消 使 用 小 的 CPU 的 好 处 加 

重复 数据 ”著名 的 研究 员 Leslie Lampor 曾 经 说 过 :“ 我 还 没有 听 说 过 在 分 布 式 系统 中 有 某 
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些 计算 机 失效 以 后 还 可 以 继续 完成 我 的 工作 。” 显 然 ， 这 问题 是 对 数据 进行 了 划分 ， 如 果 许 多 
事务 需要 从 多 个 计算 机 上 获取 数据 〈 这 不 是 TPC-A 事 务 的 问题 ， 因 为 它们 太 简 单 了 }， 则 更 容 
易 引 起 这 种 错误 。 如 果 有 一 组 每 月 只 失效 一 次 的 CPU (假设 每 天 8 个 小 时 ， 每 周 5 天 工作 日 )， 
则 把 100 台 这 和 样 的 计算 机 组 成 分 布 式 数据 系统 时 ， 则 它们 中 每 1.7 个 小 时 就 会 有 一 个 失效 (与 
大 型 CPU 相 比 还 要 考虑 的 是 低档 CPU 的 内 部 平均 出 错时 间 }。 为 了 克服 这 个 问题 ， 标 准 的 方法 
是 复制 数据 库 中 的 数据 ， 这 样 数 据 不 是 进行 简单 的 划分 ， 而 是 至 少 保存 在 两 台 机 器 上 - 这 种 
做 法 的 缺点 是 在 数据 更 新 时 至 少 要 与 两 台 计 算 机 通信 。 同 样 有 通 优 的 问题 并 增加 了 分 布 式 数 
据 库 系统 中 的 其 他 开销 。 

盟 然 更 新 事务 有 这 么 多 的 复杂 问题 ,但 是 无 共享 式 数 据 库 系 统 即 将 到 来 。 经 济 性 和 易 用 
性 是 设计 新 数据 库 系 统 时 考虑 的 重点 ， 目 前 新 的 方法 还 在 不 断 地 尝试 中 。 


11.4 ”查询 并 行 性 


直到 现在 我 们 主要 集中 在 如 何 用 钨 CPU 体系 结构 来 支持 事务 更 新 ， 并 且 目 前 所 遇 到 的 大 
部 分 困难 都 围绕 着 执行 更 新 的 需要 。 但 是 现在 有 越 来 越 多 的 应 用 系统 主要 用 于 查询 ， 很 少 有 
在 线 更 新 ， 新 旧 数 据 的 合并 主要 也 是 离线 操作 的 。 比 如 ， 许 多 大 百货 公司 一 般 通 过 研究 过 去 
顾客 的 购买 习 悍 来 次 定 放置 商品 的 位 置 和 需要 对 哪些 顾客 邮件 通知 。 刀 乎 所 有 的 商人 都 会 用 
已 有 的 数据 来 决定 以 后 的 订单 。 重 新 订购 主要 通过 简单 地 播 人 探 作 来 实现 ， 而 订单 的 内 容 主 
要 通过 查询 来 实现 。 由 和 于 市 场 专家 并 不 会 只 是 简单 地 重新 订购 以 前 订 过 的 东西 ， 所 以 这 里 的 
查询 可 能 会 很 复杂 。 行 细 分 析 来 决定 应 订购 哪些 产品 、 哪 些 季 节 性 商品 要 贮存 或 如 何 改变 商 
店 格局 使 商品 更 加 明显 。 这 类 系统 就 叫 决策 支持 系统 (DDSS )。 许 多 大 公司 (如 药品 批发 商 ) 
把 这 种 分 析 作 为 增值 服务 提 殿 给 他 们 的 顾客 。 主 要 用 于 查询 的 系统 还 有 许多 ， 如 图 书馆 、 书 
店 、 音 像 店 、 警 察 局 许可 证 查询 ， 等 等 。 

在 只 用 于 查询 的 分 布 式 系统 中 ,显然 没有 两 阶段 提交 、 事 务 阻塞 (没有 写 锁 ) 或 分 布 式 
死 锁 的 问题 。， 可 果 为 了 避免 菜 些 站 点 失效 ， 可 以 在 几 个 站 点 上 复制 数据 ， 也 不 用 考虑 同时 更 
新 多 个 站 点 的 问题 。 现 在 体系 结构 所 面临 的 主要 挑战 是 如 何 分 解 一 个 查询 ， 使 其 可 以 在 多 个 
不 同 站 点 上 并 行 操作 ， 这 就 是 查询 内 并 行 性 。 

查询 内 并 行 性 

下 面 给 出 一 个 典型 的 无 共享 式 查询 系统 。 与 先前 提 到 的 TPC-A 不 同 ， 要 查询 的 Account 
表 钙 划分 到 K 个 不 同 的 站 点 上 ，account 表 被 划分 成 : Acct 1 在 站 点 1 上 ，Acct 2 在 站 点 2 上 ， 
ee ，Acct 区 在 节点 KK 七 。 这 些 站 点 机 器 不 共享 内 存 或 磁盘 ， 但 它们 可 以 通过 通信 网络 发 消 县 
来 联系 。 现 在 很 设 在 站 点 1 要 查询 老龄 客户 的 峰 号 入 息 : 


(Tl select Account. name. Account.phone from Account 
where Account ,age >= 63; 


在 现在 的 体系 结构 中 没有 哪个 站 点 有 完整 的 Account 表 ， 因此 最 直接 的 方法 就 是 把 杏 向 
[11.4.1] 分 解 为 K 个 不 同 的 查询 Q;， 它 的 形式 如 下 : 
select Acctd.name, Acctl.phone from Accty 
where AcctJ.age >= 65} 
这 里 ] 的 取 值 范围 为 1 到 K。 查 询 协 调 程 序 需 要 给 站 点 ] 发 查询 Q; 请 求 ， 各 个 站 点 根据 本 站 
点 的 数据 返回 结果 给 查询 协调 程序 ， 这 里 就 是 站 点 1。 而 站 点 1 收集 这 些 站 点 的 返回 信息 ， 拼 
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次 起 来 形成 续 采 。 

值得 注意 的 是 ， 有 时 查询 协调 程序 的 工作 可 能 很 复杂 ， 比 如 ， 如 果 在 查询 [11.4.H 中 附 市 
ORDER BY 子 可 ， 好 . ,，，aeraer by Account .name, 这 样 各 站 点 上 的 查询 Q, 都 有 这 个 于 
句 ， 它 们 结果 也 是 按 合适 的 次 序 返 回 。 但 是 查询 协调 程序 仍 需要 把 所 有 结果 重新 排序 。 从 先 
前 的 查询 可 以 着 出 ， 如 果 只 是 对 早期 返回 的 结果 的 行 集合 有 一 点 疑问 的 话 ， 束 有 理由 限制 结 
果 的 具体 化 。 这 种 特征 会 使 协调 程序 更 加 复杂 。 当 修改 查询 [11.4.8 如 下 时 ， 又 会 有 新 的 问题 
出 现 : 


[4.2] select countc*)y from Account where Account.age »= 65; 


这 个 查询 也 要 分 解 为 站 点 部 分 的 查询 ， 然 后 由 协调 程序 把 不 同 站 点 的 查询 结果 加 起 来 得 
到 最 后 的 结果 。 

最 难 的 问题 是 需要 不 同 站 点 表 连 接 的 查询 结果 。 现 在 假设 个 人 可 以 在 不 同 的 银行 部 门 有 
多 个 账号 ， 但 是 有 一 个 是 主 账号 。 在 账号 表 中 有 一 个 字段 acct.type 来 记录 是 主 账 号 还 是 从 
账号 。 是 从 账号 的 数据 中 有 一 个 列 值 为 Pracct_ID， 记录 相应 的 主 账 号 的 Account_IP 的 值 
{ 主 账号 行 的 Pracct_ID 为 空 )。 现 在 考虑 一 下 多 个 账号 持 有 者 的 多 个 账号 的 查询 : 

[11.4.3] select Al.Account ID, Al.balance, A2.AccoOUuNt. Id, A2 .balance 

from Account Al, Account A2 


Where AZ.acet type = Secondary’ 
dnd A2.Pracct id = Al.ACCOUNt_ 1D: 


现在 考虑 一 下 这 个 查询 如 何在 我 们 讨论 的 多 个 站 点 数据 库 中 执行 。 我 们 可 以 将 查 淘 对 应 
站 点 ] 分 段 成 不 同 的 查询 Q;，] 从 1 到 K， 这 里 从 账号 被 定位 : 


[UA] select Al,Account. ID, Al.balance, A2?.ACCoOuNnt_ Id, A2.balance 
from Account Al, Acet] A2 
where AZ.acct_type = ‘secondary' 
and A2.Pracct_Ih = Al,Acctount_ID: 


但 是 我 们 注意 到 主 账号 的 Account 表 还 是 需要 多 站 点 间 连 接 ， 在 这 种 环境 下 路 站 点 间 连 
接 是 不 可 避免 的 。 站 点 J 的 查询 [111.4.41] 的 一 种 可 能 执行 计划 是 收集 aectJ 中 所 有 的 
accout_ID 到 集合 和 中 : 

[11.4.5] select Al.Pracct_ID into % 


from Accty] A2 
where A2.acct type = Secondary': 


弄 在 把 站 点 J 的 集合 和 划分 为 买 ，， 总 ,， “ : 其 中 集合 丸和 包 含有 与 站 点 M 的 Accout_ID 
匹配 的 Pracct_ID 值 (系统 知道 &ccount 表 的 不 同行 按 主 键 值 贮存 在 哪里 )。 现 在 站 点 J 给 涉 
同 的 站 点 M 发 送 消 息 请 求 查询 的 结 采 : 


[1 select Al.Account ID. A2.balance 
from AcctM al 
where Al.Account IO Th Xp: 


当 不 同 站 点 M 都 把 查询 结果 返回 给 站 点 J 后 ， 连 接 一 下 就 是 查询 [11.4.4] 的 结果 。 所 有 形 如 


[11.4.4 的 不 同 查询 的 结果 返回 后 就 是 查询 [11.4.3] 的 绪 末 。 
多 站 点 无 共享 式 数据 库 的 查询 在 涉及 到 多 层 站 总 内 销 轧 时 融会 世 得 非常 复杂 。 显 然 由 于 
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这 种 方法 涉及 到 了 不 同 赣 点 加 的 数据 流 ， 所 以 在 广域网 上 由 有 低速 通信 和 能 力 的 分 布 式 节点 集 
合 是 有 很 大 缺陷 的 ， 无 共享 式 查询 的 一 个 详细 信息 可 和 参考 DeWitt 和 Gray 的 论文 推荐 读物 (推荐 
读物 [2])。 


推荐 读物 


分 布 式 数据 库 系 统 设计 所 涉及 到 的 不 同 问题 在 Dzsu 和 Valduriez 的 文章 小 有 很 好 的 表述 ( 推 


荐 读物 [7 。Bernstein、Hadzilacos 和 Goodman 的 文章 (推荐 读物 [1 对 分 布 忒 冲 务 做 了 一 个 很 
严格 的 介绍 ， 而 Gray 和 Reuter 在 设计 与 实现 方面 做 了 很 好 的 简介 (推荐 读物 |5]))， 他 们 的 文章 对 
TP 监视 恬 也 做 了 很 好 的 介绍 。Khosafian，Chan、Wong 和 Wong 的 文章 (推荐 读物 [6]) 介 绍 了 多 
个 系统 下 用 SQL 编写 客户 机 -服务 器 应 用 程序 的 一 些 基 本 概念 。 并 行 查询 问题 在 DeWitt 和 Gray 
的 论文 (推荐 读物 [2]) 中 进行 了 讨论 ， 推 荐 读物 [4 《The Benchmark Handbook? 主要 处 理子 
Wisconsin 测 试 。Stonebraker 的 一 些 论文 {推荐 读物 [8]} 也 是 有 关 分 布 式 数据 库 系 统 的 。 
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习题 


HL 对 以 下 问题 回答 对 或 错 ， 并 给 出 理由 。 
(a) 在 共享 内 存 式 多 仆 理 器 系统 中 为 保证 协同 事务 ,两 内 段 提 区 是 必须 的 。 
(b) 在 只 处 理 查 询 的 无 共享 式 DS3S 系 统 中 分 布 式 死 锁 是 不 可 能 的 。 
{c) 在 客户 机 -服务 器 体系 结构 下 服务 器 不 能 是 无 共享 式 并 行 数据 库 系 统 。 
fd) 根据 图 11-6， 五 个 60MIPS 的 CPU 比 一 个 300MIPS 的 CPU 便宜 。 
{e) 一. 个 准备 态 的 事务 在 它 所 在 的 站 点 机 器 崩溃 而 后 又 恢复 之 后 仍然 可 以 提交 。 
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A.1 在 ORACLE 中 安装 CAP 数 据 库 


本 节 解 释 完 成 第 3 童 中 练习 3.2.1 所 需要 的 技能 。 练 习 SQL 数 据 定义 语句 来 创建 数据 库 表 ， 
以 复制 图 2-2Customers-agents-products (CAP) 数据 库 的 上 机 作业 。 通 过 本 部 分 的 学 
习 ， 你 将 明白 如 何 从 操作 系统 进 人 数据库、 如 何 把 数据 从 操作 系统 的 文件 中 装 人 数据 库 以 及 
如 何 操 作 SQL*Pilus 交 互 式 环境 。SQL*Plus 有 很 多 命令 可 以 让 你 编写 SQL 语 句 、 编 辑 它 们 、 把 
它们 保存 到 操作 系统 的 文件 中 去 、 再 把 它们 从 文件 中 读 人 等 。 像 在 3.2 节 中 介绍 的 那样 ， 你 首 
先 需 要 获得 一 个 操作 系统 的 账号 一 一 一 个 用 来 登录 到 计算 机 的 操作 系统 用 户 ID 和 口令 一 和 一 
个 用 来 进 和 数据库 的 ORACLE 名 和 和 口令。 在 你 安装 时 ， 你 的 指导 老师 或 DBA 应 该 可 以 给 你 提 

在 DRACLE 中 ， 一 般 都 只 有 一 个 属于 数据 库 管理 员 的 数据 库 。 和 在 INFORMIX 中 不 一 - 样 ， 
ORACLE 的 单个 的 用 户 一 般 并 不 创建 他 们 自己 的 数据 库 。 为 了 保证 不 同 用 户 的 数据 能 够 彼此 
区 分 ， 数 据 库 管 理 员 授予 每 个 用 户 访问 一 个 数据 库 中 的 秘 有 表 空 间 【《tablespace ) 的 权利 。 一 
个 表 空 间 就 像 一 个 包含 表 集 全 的 目录 。 我 们 仍 将 非 正 式 地 称 一 组 相关 的 表 为 一 个 “数据 库 ”， 
例如 图 2-2 中 的 CAP 数 据 库 。 

1. 创建 CAP 数 据 库 

为 了 进 人 ORACLE， 输 人 如 下 操作 系统 命令 : 

[A.1.1] sqlplus 

ORACLE 会 提示 你 输入 数据 库 用 户 各 和 口令 (此 时 ，DBA 应 该 已 经 给 了 你 数据 库 用 户 和 名 
和 口令 )。 如 果 你 的 用 户 名 和 口令 被 接受 了 ， 那 么 你 将 看 到 一 个 新 的 提示 符 : 

SOL> 

”这 意味 着 你 现在 正在 SQL+Plus 交 互 式 环境 下 。 此 环境 下 的 很 多 命令 (主要 是 编辑 命令 ) 

将 在 下 一 节 介 绍 。 现 在 ,我 们 集中 讨论 你 将 要 创建 的 SQL 语 句 。 这 些 5QL 语 句 是 真正 对 
ORACLE 系 统 的 指令 (而 不 是 针对 交互 式 环 境 的 ， 交 互 式 环境 仅 仪 是 用 来 编写 这 些 语 名 的 )。 
它们 使 你 可 以 创建 表 、 载 入 表 、 进 行 查 询 等 。 按 照 在 3.2 节 中 的 介绍 ， 在 ORACLE 中 创建 CAP 
数据 库 的 CUSTOMERS 表 ， 使 用 小 写 的 表 和 名 customers。 你 可 以 使 用 以 下 语句 来 创建 表 : 

SOLY create table customers cid chart4) not nutl, cname varchart13), 

2 city varchart20), discnt real, primary Key (cid}): 

注意 ， 在 第 一 行 按 了 Enter 键 以 后 ， 系 统 显 示 -个 第 二 行 的 提示 符 : 2。 第 三 行 的 提示 符 是 
3， 以 此 类 推 。 你 可 以 输入 的 行 的 数目 没有 限制 。 在 你 用 分 号 〔; ) 作为 某 行 的 结束 之 北 ， 系 
统 不 会 试图 解释 你 的 输 人 。 

Create Table 语 句 的 结果 是 创建 了 一 张 带 列 名 (或 称 为 属性 ) cida，cname，city 和 
discnt 的 空 customers 表 。 每 个 属性 的 类 型 ( 又 称 为 属性 的 域 ) 在 每 个 属 人 性 名 后 给 定 。 于是， 
cmame 的 类 型 是 varcharf(13) ! 意味 着 长 度 最 多 为 13 个 字符 的 变 长 字符 串 )， 而 4iscnt 的 类 型 
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是 real。 请 参考 3.2 节 以 获得 重 多 的 内 容 ， 并 请 参考 A.3 节 “数据 类 型 ”以 得 到 ORACLE 数据 类 
弄 的 完整 列表 。ORACLE 支 持 ANSI SQL 数据 类 型 名 integer ( 整数 )、real ( 实数 )、double 
precision〈 六 精度 ) 等 。 这 些 数 撕 类 型 和 马上 自己 的 数据 类 型 (numbertm) 等 ) 一 起 都 满足 最 基 
本 的 范围 和 精度 要 求 。 我 们 将 使 用 ANSI SQL 数据 类 型 名 来 代替 ORACLE 专用 的 名 称 来 使 SQL 
语句 尽 可 能 易于 移植 。 

现在 ， 我 们 已 经 有 了 一 张 表 ， 我 们 可 以 向 其 中 装 人 数据 。 为 了 做 到 这 一 点 ， 我 们 通过 在 
SQL 提示 符 下 键 人 人 exit 退出 SQLrPlus， 然 后 运行 SQL*Loader 工 内。 

2. 使 用 SQL*Loader 

SQL*Loader 是 从 操作 系统 文本 文件 读数 据 并 把 内 雁 转化 为 表 中 的 字段 的 工具 程序 。 为 了 
做 到 这 一 点 ， 它 必须 被 告知 要 装 人 的 外 部 数据 的 格式 。 此 描述 存放 于 控制 文件 中 ， 控 制 文件 
的 文件 名 后 刍 一 般 为 “.ctl”"。 例 如， 控制 文件 custs.ctl 是 这 样 的 : 

load data 

replAace 

into table customers 


fields terminated by "," 
tcid, chname, city, discnt) 


数据 文件 -- 般 后 毁 为 .dat。 它 包 育 电 装 入 到 表 中 去 的 数据 。 毛 的 惰 式 : 定 要 利 控 制 文 件 中 
的 描述 一 致 。 例 如 ，custs.dat 是 这 样 的 ， 


econl,Tiptop, Duluth.10.0 
coO02.Basics,.Dallas.l2.0 
CD03,AT1ied, Dallas.8.00 


为 了 运行 载 人 工具 ,输入 以 下 操作 系统 命令 : 


sqliead control=custs.ctl 
接着 SQL*Loader 就 会 提示 你 输入 ORACLE 用 户 名 和 口令 。 如 果 你 愿意 ， 你 可 以 在 命令 行 
中 输入 用 户 名 和 口令 、 


1 1 Oad WSseTN#Mme/ pasord CONntrol—tusts .ctl 


注意 ， 此 命令 假设 在 输入 此 命令 时 custs.ctl 在 当前 目录 下 。 否 尖 就 需要 输入 更 完整 的 路 径 
名 。 人 例如， 在 UNIX 中 ， 文件 custs .ctl 在 poneil 的 用 户 日 录 的 oracle 子 日 录 下 ,那么 ， 在 
Copy 命 令 中 ,将 用 /usr/poneil/oraclie/custs.ctl 来 表示 该 交 件 .不管 是 上 述 哪 种 情 
况 ，SQL*Loader 都 要 有 对 包含 控制 文件 的 目录 的 写 权 限 ， 这 样 它 才 能 建立 日 志文 件 (log file ) 
和 出 铺 文 件 【bad file )。 日 志文 件 的 扩展 名 为 .log， 它 包含 了 装 和 过程 的 详细 报告 。 出 错 文件 
的 扩展 各 为 .bad， 它 包含 了 不 能 被 正确 读 信 的 记录 。 在 你 使 用 custs .ctl1 和 custs,aat 前 ， 
你 需要 将 它们 从 指导 老师 的 主页 或 者 本 书 的 主页 拷贝 到 你 自己 的 目录 中 去 ; 如 果 企 图 在 指导 老 
师 或 者 DBA 的 目录 中 创建 日 志文 件 和 出 错 文 件 中 ，sqllocad 将 失效 ， 这 是 因为 你 对 于 该 目录 
只 有 读 权 限 。 

你 现在 已 经 知道 如 何 创 建 表 并 装 入 数据 了 ， 你 还 舌 要 知道 如 何 “ 销 磺 ” 上 表 { 就 像 在 目录 
中 删除 文件 那样 ， 把 表 从 数据 库 中 删除 )。 像 3.2 节 介绍 的 那样 。 为 此 我 们 使 用 命令 ; 


IA.2} drop table tablername: 
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所 有 的 袁 可 以 有 一 个 包含 语句 的 文件 来 创建 ， 这 里 我 们 假设 它 叫 做 create .sql。 我 们 
把 它 提供 给 SQL*Plus， 如 下 : 

sqlplus username/ password Screate.sdl 

文件 create .sql 有 以 下 内 容 。( 注意 ， 如 果 在 数据 库 中 有 以 前 艇 本 的 表 ， 在 创建 表 之 前 
要 删除 它们 。 ) 双 连 字号 表示 该 行 剩 下 的 内 容 是 注释 ， 为 不 执行 的 内 容 。ORACLE 也 人 允许 C 语 
言 风格 的 注释 语法 /*..….*7， 但 这 不 是 ANSI 标 准 ， 不 能 移植 到 其 他 数据 库 系 统 上 去 。 


-- create.sql: SOL script tile for table creation 


drop tabile customers:; 

create table customers tcid char(ta#) not null, cname varchart13}, 
City varcharted}, discnt real, 
primary Key tctd))}: 


drop table agents: 

create table agents (aid char{3) not null, aname varchartl3). 
city varchar(20), percent smallint, 
primary key taid}y: 


drop table productss 

create table products (pid chart3y not null, pname varchart13)., 
eity varchart20), quantity Tnteger, price double precision. 
primary key (pid)}: 


drop table orders: 

craeate table orders tordno integear not null, month chart3), 
cid chartd4), aid chart3), pid chart3), 
dty Tnteger, dollars doubte precision., 
primary Key {ordno}}: 


这 里 ， 我 们 使 用 的 是 SQL-92 的 数据 类 型 ， 而 不 是 由 于 历史 原因 更 广泛 地 被 使 用 ORACLE 
所 特有 的 类 型 。 一 个 受过 ORACLE 训 练 的 DBA 会 为 整 型 的 数量 属性 使 用 number(5) 或 者 
number(10)， 而 为 货币 属性 使 用 npumber(10,2)}， 并 为 双 精 度 属性 使 用 float。 而 在 这 里 ， 我 们 为 
货币 属性 使 用 double precision。 介 是 numeric(10,2) 和 decimal(10,2) 这 些 SQL 标 淮 数据 类 型 也 常 
常 答 用 来 表示 货币 属性 。 这 样 做 的 好 处 是 正好 可 以 得 到 “分 ”， 而 以 “元 ”为 单位 。 而 如 果 使 
用 double precision， 只 有 当 最 小 单位 是 “分 ”的 时 候 ， 才 能 准确 到 “分 "。 这 是 因为 1/100 不 是 
二 进 制 有 限 分数 。 

在 上 面 的 命令 执行 以 后 ， 那 些 表 就 可 以 在 操作 系统 命令 中 使 用 salloadqd 装 人 了 : 

sqlload userrname/password controlecusts, ct] 

sqlload username/password control=ageants.ctl] 


sqlload username /password control=prods.ct' 
sqlload username/password control=orders.ct] 


为 了 让 该 工作 全 自动 地 完成 ， 把 sqlplus 命 令 和 sqlload 命 令 放 在 一 个 命令 文件 中 ( 例 


如 ， 和 Windows NT 或 其 他 系统 中 的 loadcap. cmd， 或 者 UNIX 中 前 lcadcap} 于 是 ， 丰 全 令 行 
中 运行 1oadcap 就 可 以 完成 所 有 的 工作 了 了 。 
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3. 使 用 SQL*Plus 
SOQL*Plus 就 是 你 在 操作 系统 下 输入 sqlplus 后 进入 的 环境 。 一 十 始 ， 你 会 看 到 提示 符 ; 


SAL» _ 


你 可 以 输入 你 想 输 入 的 任何 SQL 语 名 。 如 果 该 语句 在 一 行 中 放 不 下 ， 你 可 以 继续 使 用 下 
一 行 ，SQL+PIus 会 在 每 个 新 行 的 头 上 显 隶 行 号 作为 提示 符 。 例 如 ， 
SOL> select * rom customers 
2 where cname 一 “Tiptop” 


SQL*Plus 不 会 试图 釉 泽 此 语句 ， 队 非 你 输入 分 号 作为 结束 : 
SOL> select * from Sustomers 
2 where cname = 'Tiptop': 


在 第 二 行 中 按 了 Enter 键 以 后 ，SQL*Plus 显 示 出 和 查询 相 匹 本 的 行 ， 并 返回 给 你 SQL> 提 
示 符 。 也 可 以 输入 一 条 命令 而 不 执行 它 ， 该 特性 的 用 途 将 稍 候 再 介绍 。 为 了 中 目 : -条 命令 而 
不 执行 它 ， 你 只 要 输入 个 空 行 ， 然 后， 你 就 回 到 SQL> 提 示 符 下 。 命 令 的 内 容 (无 论 是 否 执 
行 了 ) 存放 在 缓冲 区 中 。 通 过 输入 命令 1 或 者 1ist， 我 们 可 以 看 到 缓冲 区 的 内 容 。 


SQL» 1 
1 select * from customers 
2* where cname="Tiptop' 
SOL> _ 


处 理 缓 溃 的 SQL*Plus 命 令 ， 例 如 1， 并 不 存放 于 缓冲 区 中 ; 否则 它 将 严重 地 限制 该 命令 
的 用 途 。 

在 上 人 曾 的 例子 中 ，2 后 面 的 星 号 表示 者 剖 中 的 当前 行 ， 它 将 会 被 名 条 SQL*Plus 命 令 使 用 。 
要 改变 当前 行 ， 只 要 在 SQL 提示 符 下 输入 行 号 就 可 以 了 。 


$i» 1 
1* seElect * from customers 


30L> .- 


为 了 修改 当前 行 中 的 一 小 部 分 ， 你 可 以 用 命令 c 或 者 change， 这 样 就 森 需 要 重新 输入 整 
个 俩 令 丁 。 该 命令 用 新 的 文字 序列 替换 掉 上 时 的 序列 。 例如 : 
SOL> c recustomersiagents 


Y* Select * from agents 
SOL> 


其 中 ， 斜 杠 (/ ) 被 称 为 分 隔 字 符 。 你 可 以 使 用 任何 非 字母 数字 的 字符 作为 分 隔 字 符 。 例 
如 ,命令 c &customers&agents 和 上 述 命令 是 等 价 的 。 如 果 要 山 除 当前 行 的 一 个 字符 串 ， 
只 要 简单 地 用 一 个 空 串 代 状 就 可 以 T。 

SOLY ce ragentss 

l* select * from 

SOL> _ 


如 果 要 替换 瑞 行 的 内 容 ， 只 要 输入 行 导 ,然后 输入 新 的 内 容 就 可 以 了 。 
SOL 1 select * FOM CUStOmes 


要 重新 执行 (可 能 修改 过 的 ) 缓冲 区 中 的 内 容 ， 可 以 使 用 命令 /; 也 可 以 使 用 命令 x 重出 
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缓冲 区 的 内 容 ， 并 执行 它们 。 
你 可 以 使 用 命令 Gel 删除 缓冲 区 中 的 当前 行 。 你 还 可 以 用 命令 i 在 当前 行 后 插入 一 行 。 此 
命令 有 两 种 使 用 方式 ， 你 可 以 擂 入 在 命令 i 后 所 跟 的 单行 内 容 ; 


SQL 1 Where cid = *cOOL* 
SOL> _ 


或 者 使 用 不 带 参 数 的 命令 来 输入 多 行 : 
SOL> 1 
2 Where cid 
3 一 “no1l 


在 这 种 方式 下 ，SQL*Plus 的 表现 就 像 你 在 前 面 的 命令 后 继续 输入 一 翌 【 或 是 在 一 个 很 大 
的 缓冲 区 的 某 一 行 后 播 人 ) 如 这 个 例子 所 示 ， 结 束 的 分 号 使 得 整个 组 冲 区 中 的 内 容 被 执行 。 
现在 ， 我 们 使 用 这 些 命令 来 修改 一 个 典型 的 拼 与 错误 。 人 恨 设 输入 了 : 


和》 sellect * from customers 
2 where cname = "Tiptop_ 


而 后 意识 到 拼写 错误 ， 你 可 以 通过 结束 命令 (输入 一 个 空 行 )、 选 择 要 修改 的 行 、 用 正确 
的 单词 代 巷 拼 铺 的 单词 并 执行 缓冲 区 内 雁 来 纠正 它 。 
SOL seltect * fram customers 
? where crname = "Ttptop” 
3 


SOL> 1 

1* sellect = from cuUSTOMErS 
SOL> €¢ Hsell/sel 

i* select * from customers 
SOL> 7 


这 样 敌 的 效果 和 重新 输入 命令 是 一 样 的， 但 是 这 样 做 击 刍 次数 较 少 。 

使 用 edit 命 令 可 以 调用 你 的 系统 编辑 器 。 如 果 不 用 参数 ， 它 将 让 编辑 器 编辑 缓冲 区 中 的 
肉 容 。 你 也 可 以 指定 要 编辑 的 文件 名 称 。 

为 了 要 在 SQL*Plus 环 境 下 执行 SQL 命令 文件 ， 需 要 使 用 带 命令 文件 名 的 @ 人 命令。 如果 和 级 
仅 要 把 命令 交 件 装 入 缓冲 区 ， 可 以 使 用 带 文 件 名 的 get 命 令 。 如 果 要 把 缓冲 区 中 的 内 容 存 入 
文件 ， 可 以 使 用 带 文 件 名 的 sav 不 save 命 令 。 

作为 总 和 结 ， 这 里 给 出 SQL*Plus 环 境 下 可 用 的 命令 列表 : 


ce /old/new 在 当前 行 中 把 第 一 次 出 现 的 旧 字 符 串 修改 为 新 字符 串 。 
1 列 出 缓冲 区 中 的 内 容 。 

Gel 从 缓冲 区 中 删除 当前 行 。 

i new line 在 缓冲 区 中 当前 行 后 本 人 一 新 行 。 

i 开始 在 缓冲 区 中 当前 行 后 交互 式 地 插入 新 行 。 

/ 执行 缓冲 区 中 的 语句 。 

r 列 出 并 执行 缓冲 区 中 的 语句 。 


edit filename 使 用 缺 省 的 操作 系统 编辑 器 编辑 文件 。 
edit 使 用 缺 省 的 操作 系统 编辑 器 编辑 缓冲 区 。 
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filename 执行 在 filename 文 件 中 存放 的 SQL 语 铝 。 

get filename 把 filename 文 件 中 的 内 容 装 人 组 冲 区 。 

save filename 把 缓冲 区 存放 到 指定 的 文件 中 去 ( 矫 盖 掉 原 来 的 文件 )。 

5 new line 奉 换 第 5 行 。 

5 设置 当前 行为 第 5 行 。 

host command 执行 指定 的 操作 系统 命令 ， 

Spool filename 开始 把 用 户 交 互 (用户 击 键 和 输出 ) 存 人 指定 的 文件 。 

spool off 结束 上 一 个 spcol 命 令 开 始 的 存放 用 户 交互 行为 ,并 关闭 文件 。 
exit 退出 SQL*Plus 环 境 。 


如 果 edit 命 令 无 效 ， 那 么 你 就 需要 执行 SQL*Plus 命 令 define_eGitor 
='editor_name'。 可 以 使 用 上 自动 的 启动 文件 来 完成 此 设置 ， 但 是 那 已 经 超出 了 此 总 结 的 范 
围 了 . 


A.2 在 INFORMIX 中 安装 CAP 数 据 库 


本 蔬 介 绍 完 成 第 3 章 中 练习 3.2.1 所 需要 的 技能 。 练 习 SQL 数 据 定义 语句 来 创建 数据 库 表 ， 
以 复制 图 2-2 中 CAP 数 据 库 的 上 机 作业 。 通 过 本 部 分 的 学 习 ， 你 将 明白 如 何 从 操作 系统 进入 数 
据 库 ， 如 何 把 数据 从 操作 系统 的 文件 中 装 人 数据 库 以 及 如 何 执行 SQL 语句 、 编 辑 它们 、 把 它 
们 保存 到 操作 系统 的 文件 中 去 、 把 它们 从 文件 中 读 和 人 等 。 像 在 3.2 节 中 介绍 的 那样 ， 你 首先 需 
要 获得 一 个 操作 系统 的 账号 一 一 一 个 用 来 登录 到 计算 机 的 操作 系统 用 户 I[D 和 和 口令。 安装 时 ， 
你 的 指导 老师 或 DBA 应 该 可 以 给 你 提供 指导 。 此 外 还 需要 设置 一 些 环境 变量 ， 例 如 对 UNIX 用 
户 需 要 设置 INFORMIXDPIR 。 注 意 下 面 所 说 的 INFORMIX 交 互 式 菜单 环境 只 适用 于 UNIX 操 作 
系统 。Windows 操 作 系 统 使 用 的 是 一 种 不 同 的 界面 : sqleditor 工 上 只。 我 们 准备 将 来 对 Windows 
界面 编写 另外 一 个 教程 ， 把 它 放 在 网 页 http:i/www.cs.umb.edu/~poneil/dbppp.html 上 。 

INFORMIX 和 ORACLE 不 一 样 ， 用 户 一 般 都 可 以 创建 自己 的 数据 库 。 创 建 CAP 数 据 库 包 
括 建 立 自己 的 数据 库 ， 热 后 三 数据 库 中 创建 CAP 的 表 。 如 果 你 在 使 用 UNIX 系 统 ， 为 了 在 你 创 
建 数据 库 前 进入 INFORMIX 交 互 式 环境 ， 输入 操作 系统 价 令 dbaccess。 

1. 创建 CAP 数 据 库 {在 UNIX 中 ) 

在 UNIX 中 执行 abaccess 命 令 以 后 ， 你 将 看 到 只 有 一 行 的 菜单 


[A.2.1] DBEACCESS: 0uery-1anguage Cornection Database Table Session Exit 
通过 键入 da 来 选择 Database 选 项 ， 或 者 使 用 左 箭头 便 Database 商 亮 显 示 ， 然 后 按 Return 键 。 
下 一 个 菜单 是 ， 


[B22.2] DATABASE: Select Create Info Drop Close Exit 


通过 键入 c 来 选择 Create 选 项 ， 然 后 根据 要 求 输入 数据 库 名 称 ， 此 名 称 可 以 根据 你 的 用 户 
名 决定 ， 或 者 由 你 的 指导 老师 决定 ， 例 如 eoneildb。 接 着 ， 妆 要 求 决定 Pbspace 的 时 候 ， 键 人 ee 
以 选择 缺 省 值 退 出 。 会 有 一 个 缺 省 选择 为 “Create-new-database” 的 荣 单 要 求 你 确认 创建 数据 
库 的 行为 ， 按 Enter 键 选择 缺 省 值 ， 然 后 键入 e 以 退出 Datahase 菜 单 。 如 果 你 还 想 退 出 Dbaccess， 
那 冬 就 再 键 人 一 个 es。 如 果 你 在 任何 时 候 忘 了 自己 到 底 选 择 了 什么 选项 或 在 菜单 层次 中 陷入 御 
环 的 话 ， 你 可 以 通过 按 Ctri-W 来 获得 帮助 。 连 续 地 按 e 退 出 并 不 一 定 能 退出 循环 ， 尽 管 这 应 该 
是 你 首先 尝试 的 。 





-一 一 一 -= 
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现在 ， 你 已 经 有 了 一 个 数据 库 了 。 下 次 执行 abaccess， 你 应 该 在 区 信行 中 提供 数据 库 
名 ， 即 dbaccess eceneiladab， 你 将 会 看 到 LA.2.1] 中 那样 的 单行 菜单 。 通 过 按 Enter 键 选择 第 
一 个 加 亮 的 选项 Query-laneuage 就 进入 了 下 一 个 菜单 : 

[BA.2.3] SoL: Hew Run Modify Use-editor Dutput thoose Save Info Droep Exit 

用 相同 的 办 法 选择 New 来 并 始 一 个 新 的 SQL Editor 会 话 以 编写 SQL 语句。 在 此 环境 下 ， 你 
可 以 为 CaAP 数 据 库 创建 表 。 首 先 ， 输 入 SQL 语句 : 


create table testlceoll int}: 


屏幕 的 顶端 显示 如 下 : 

NENW: ES 一 Done edtt1rg CTRL-A = Typeover/Insert CNTL-R = Redraw 
CHTL-X 一 Delete character CTRL-D = Delete rest of Tine 

~- eonet1di@dbserver---------------Press CTRL-W for Help- -7 


create table testlceoll int}; 


按 Esc 键 从 编辑 状态 回 到 高 层 菜 单 [A.2.3]， 然 后 选择 Run 执 行 语句 。 你 应 该 在 屏幕 底部 看 
到 “Table citeated” 或 者 类似 的 输出 。 

如 果 你 的 Run 命 令 失 败 了 ， 你 就 需要 再 编辑 你 的 SQL 语句 然后 重 试 。 选 择 Query-language 
菜单 中 的 Modify， 你 就 可 以 回 到 和 选择 New 所 进入 的 一 样 的 SQL Editor 环 境 。 但 是 现在 ， 你 原 
来 输 人 的 文字 还 在 屏幕 的 底部 。 你 可 以 向 前 面 一 样 编辑 文字 ， 并 使 用 Esc 和 Enter 来 执行 语 何 。 

为 了 删除 测试 用 的 表 ， 选 择 New， 然 后 键 人 SQL 语句 : 

drop table testl: 

然后 用 前 面 介绍 的 办 法 来 执行 该 语句 。 

现在 ， 你 已 经 知道 如 何在 UNIX 中 使 用 abaccess 执 行 SQL 语 名 了 ( 或 者 已 经 掌握 了 在 
Windows 中 使 用 sqleqditor 来 完成 相应 的 工作 )。 下 面 我 们 把 UNIX 和 Windows 环 境 的 内 容 
一 起 讨论 。 像 在 3.2 节 中 介绍 的 那样 ， 在 CAP 数 据 库 中 创建 customers 表 ， 你 可 以 执行 以 下 
SQL 语 人 句 : 

create table customers {cid chartd) not nult. cname varchar(13), 
city varchart20), discnt real,. Primary Keytcid)}: 


Create Table 语 句 的 执行 结果 是 创建 了 一 个 带 列 名 《或 叫做 属性 ) cid，cname、city 和 
discnt 的 空 customers 表 。 每 个 属性 的 类 型 《又 叫做 属性 的 域 ) 在 各 个 属性 名 后 指定 。 这 
样 ，cname 的 类 型 是 varehar(13)《{ 意思 是 最 大 长 度 是 13 个 字符 的 变 长 字符 串 )， 面 aiscnt 的 
类 型 是 real。 请 参考 3,2 节 以 获得 更 进一步 的 说 明 ， 并 请 参考 A.3 节 “数据 类 型 ”以 获得 
INFORMIX 数 据 关 型 的 列表 。 我 们 将 使 用 SQL 标准 中 的 数据 类 型 的 名 称 ，INFORMIX 完 全 文 
持 这 些 类 型 。 

现在 我 们 已 经 创建 了 一 个 表 ， 我 们 可 以 把 数据 文件 中 的 数据 装 入 表 中 。 数 据 文件 的 扩展 
各 一 般 为 .dat。 例 如 ， 客 户 数 据 文 件 custs .3at 的 内 容 如 下 : 


coDi, Tiptop, Duluth.10.0 
coO0r2,Basics,.Dallas,12.0 
chi, Allied, Dallias .8.00 


为 了 载 人 ,我们 可 以 合用 INFORMIX 如 人 到 其 SQL 语言 中 去 的 Load 语 句 。 例 如 ， 为 了 把 
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custs.dat 中 的 数据 装 入 数据 库 表 customers 中 去 ,我们 可 以 使 用 如 下 SQL 语 名 (使 用 和 
执行 Create Table 语 句 相同 的 办 法 在 SQL Editor 中 输入 请 钉 ); 


ioad from custs,.dat’ delimiter “." insert into customers: 


注意 ， 此 命令 假设 custs .dat 在 输入 命令 时 在 当前 日 菏 下 。 否 则 ， 就 需要 提供 更 完整 的 
日 录 路 径 名 。 例 如 ， 在 UNIX 中 ,文件 custs .dat 在 poneii 的 用 户 目 湛 的 oracle 子 日 录 下 ， 那 
么 在 Load 命 令 中 ， 就 要 被 表示 成 /sr/poneil/oracle/custs.date 

现在 ， 你 已 经 知道 如 和 何 创建 表 以 及 如 何 装 入 数据 ， 你 还 需要 知道 如 何 “ 销 筑 ” 表 ( 就 像 
在 自 录 中 删除 文件 那样 把 表 从 数据 库 中 删除 )。 正 如 在 3.2 季 中 介绍 的 那样 ， 为 此 目的 ， 我 们 
可 以 使 用 我 们 已 泽 磋 到 过 的 如 下 命令 : 


[A2.41 drop table tablename; 


所 有 的 表 都 可 以 使 用 一 个 包含 SQL 语句 的 文件 来 创建 。 例 如 ， 我 们 将 文件 create.sGl 
必 为 UNIX 下 Sbaccess (或 Windows 下 的 SQL Editor ) 的 输 人 以 及 Windows 下 的 SQL Editer 
如 下 ， 


dbatcess eoneildb create.sol (UNIX systems, using local server] 
sqleditor /s csdb /Ad eoneildb create.sql (Windows systems. using server csdb) 


文件 create .sql 和 包含 以 下 内 容 。( 注意 我 们 在 创建 它们 之 前 先 删 除了 表 ， 以 防止 在 数据 
库 中 有 以 前 版 本 的 表 存 在 。} 双 连 字号 表示 该 行 的 内 容 是 注释 ， 即 不 需 执 行 的 文字 
INEORMIX 还 允许 用 大 括号 括 起 来 的 注释 : {.. .}, 但 是 这 不 是 ANSI 标 准 ， 所 以 不 能 移植 到 共 
他 数据 库 系 统 上 去 。 下 面 的 SQL 语句 是 标准 的 SQL ( SQL-92 和 X/Open )。 


- - Create, sql: SQL script file for table creation 


drop table customers: 
create table customers (cid chartsy not null, cname varchar(13), 


city varchart20),. discnt real, 
primary key tecid)}; 


drop table agents: 
create table agents taid chart3} not null, aname varchart(13), 


city varchart20}, percent smaliint. 
primary Key (aid)}: 


drop table products:; 
create table products [pid char{3) not nuil, pname yarchart134)}, 
city varchart20), quantity integer, Price double precision, 


primary Key (pid)}: 


drop tablie orders; 
create table orders {ordno integer not null, moanth chart3}, 


cid char{td4), aid char{3), pid chart3)., 
qty integer, dollars double precision, 
primary Key Cordno7): 


在 执行 以 上 的 命令 之 后 ， 就 可 以 使 用 以 下 和 名 为 nfload .sqgl (“lnformix load” 的 简称 ) 
的 使 用 产品 特有 的 扩展 的 SQL 肢 本 来 将 关闭 人 人。 
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-oad rows from text files into tables atready created by create,.soql 
-- Note that the "load" statement is an INFORMIX extension to SOL 


1oad from custs.dat’ delimiter '.” insert fnto customers; 
1508d from ‘agants .dat’ delimiter ,” insert nto egentss: 
10ad from ‘prods.dat’ delimiter "，” insert into products: 
1oad froem ‘orders,dat’ delimiter '," tnsert into orders; 


然后 用 运行 create .sgl 的 相同 办 法 运行 此 SQL 和 脚本。 为 了 使 此 过 程 自动 化 ， 你 可 以 在 
命令 文件 (如 Windows NT 中 的 1oadcap.cma 文 件 或 UNIX 中 的 1oadcap 文 件 ) 中 放 入 药 个 
脚 和 在 文件 执行 节令 ， 然 后 简单 的 傅 邻 行 oadeap 就 可 以 完成 所 有 的 工作 。 你 甚至 还 可 以 把 
Create Database 培 名 也 放 在 脚本 文件 中 。 此 时 ,你 需要 在 dbaccess 后 用 一 个 “-”( 连 字 符 ) 
来 代替 数据 库 名 : dpacccss - createall.sql。 如 果 你 希望 看 到 命令 执行 的 回应 ， 可 以 
使 用 -e 选 项 ， 即 abacess-e-createal1l.sqle。 

2. 使 用 DB-Access 《UNIX 系统 } 

DB-Access 是 在 操作 系统 环境 下 输入 dbaccess dbname 后 进入 的 环境 。 进 入 该 环境 后 ， 
你 将 看 到 一 个 称 为 主 菜单 的 单行 菜单 ， 

DEBEACCESS: Ouery-language Connection Database Table Session Exit 

我 们 已 经 知道 了 如 何 使 用 Database 菜 单项 来 创建 数据 库 。 一 旦 数据 库 创建 成 功 ，Query- 
language 菜 单项 就 成 为 到 目前 为 止 最 重要 的 一 项 了 。 因 为 这 一 项 在 列表 中 的 第 一 个 ， 所 以 内 
要 按 Enter 键 就 可 以 进入 Query-language 子 菜单 了 。{ 也 可 以 使 用 命令 dbaccess dbname -9 跳 这 
主 菜 单 直 接 进 入 Query-language 子 菜单 。) 然后 你 将 看 到 Query-language 荣 单 屏幕 ， 其 中 的 选 
项 如 下 : 


SOL: New Run Modify Use-editor Qutput Choose Save Info Drop Exit 


在 此 菜单 中 选择 New 以 开始 一 个 新 的 编辑 会 话 (SQL Editor ) 来 编写 SQL 查询 。 同 时 ， 你 
也 可 以 使 用 Use-editor 来 选择 系统 编辑 匿 (vi、emacs 等 )。 

在 SQL Editor 中 ， 你 可 以 输入 任何 SQL 语句 。 如 果 语 名 超过 一 行 ， 你 可 以 在 到 达 右 端 疹 的 
任何 地 方 敲 Enter 以 开始 新 的 一 行 。 注意 ，SQL Editor 并 不 会 自动 撞 行 。 如 果 输 错 了 ， 你 可 以 
使 用 Enter 和 方向 键 重 定位 光标 ， 然 后 覆盖 错误 的 内 容 。 你 也 可 以 使 用 Ctrlt+A 切 换 到 “插入 模 
式 "”。 此 时 ， 后 面 的 内 容 会 被 “ 推 开 ”， 以 容纳 新 输入 的 字符 。 再 按 一 次 Ctrl+A 会 使 系统 回 到 
“改写 模式 "。 输 入 两 行 Select 语 名 以 后 的 屏幕 如 下 : 


人 NEW : ESC 一 Done editing CTRL-A = Typeover/ lnsert CNTE-R = Redraw 
CHTL-X = Delete character CTRL-D = Delete rest of iine 
sse eoneildbedbseryer-"----"--------Press CTRL-W for Help- 


TECt rom customers 
where chame = Tipteop’: 


现在 , 按 Esc 键 以 问 到 Query-language 荣 单 , 在 这 个 菜单 中 你 可 以 使 用 Run 来 执行 这 条 语句 ， 
或 者 使 用 Modify 回 到 编辑 会 话 ， 或 者 切换 为 使 用 vi 这 样 的 系统 编辑 器 。 你 可 以 选择 Save 并 输 
和 文件 名 来 保存 输入 的 文本 。 如 果 你 的 输入 为 mytest， 那 么 文件 系统 中 的 文件 名 为 
mytest .sql， 这 是 因为 dbaccess 会 自动 加 上 所 预期 的 .sql 扩 展 省 . 

对 于 大 量 的 SQL 语 和 句 ， 使 用 系统 编辑 髓 比 使 用 3baccess 中 的 内 艇 的 简单 的 编辑 器 更 合 
适 。 一 旦 使 用 Save 或 者 其 他 编辑 器 得 到 了 一 个 SQL 语句 的 文件 ， 比 如 说 mytest .sql， 它 就 
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可 以 在 UNIXKX 命 令 行 下 运行 了 


dbaccess eoneildb mytest.sql 


或 者 ， 你 可 以 在 Query-language 菜 单 中 使 用 Choose 把 mytest ,sql 的 内 容 装 入 dbaccess 的 
内 存 ， 在 那儿 你 可 以 执行 、 修 改 或 用 其 他 编辑 器 编辑 它 ， 最 后 重新 保存 它 。 
作为 总 结 ， 以 下 列 出 了 Query-language 菜 单 下 的 菜单 合 令 : 


New 使 用 SoL Editor 输 入 新 和 的 Ss9L 语 句 。 
Run 运行 当前 的 SC5 语 何 。 
Modify 使 用 SCL Editor 修 改 当 前 的 SQL 二 名 。 
Use-editor 使 用 系统 编辑 器 修改 当前 的 SQL 语句 。 
Output 把 当前 s8L 语 句 的 执行 结果 发 送 到 打印 机 、 文 件 或 者 管道 。 
Choose 选择 一 个 包含 89L 请 句 的 文件 ， 并 使 这 些 语 侣 成 为 当前 语句 。 
Save 把 当前 的 SQL 语句 保存 为 文件 ， 以 便 以 后 可 以 再 次 使 用 它们 。 
Info 显示 当前 数据 库 中 表 的 信息 。 
Drop 删除 一 个 包含 SQL 语 句 的 文 性 。 
Exit 回 到 DB-Access 主 菜单 。 
A.3 数据 类 型 


Create Table 语 句 中 每 一 列 可 用 的 数据 类 型 如 图 A-1 所 示 。 
ORACLE | WOR | DE2 UDB 
















































































































ee 。 chariny, chartn), chartn}, 1 <n 234, char 
BEN n <= 4000 n<=32767 | n<=254 X/Open array[n+1] 
的 限制 
Dm arp ) Varcharfnm)， varcharln}, 1 <rn 254, char 
和 En VA ls n <= 255 n <= 32672 KiOpen array[n+1] 
的 限制 n <= 4000 
numericté, 0)，| numericls, 0), numeric(té, 0), | mumerictt, 0), 406 <105 1 short int, 
decimallé, 0} numberté) decimal{s, 0) decimalis, 0) [大 的 ) 















BUmerictp, 2), 
decimaltp, 2), 
moneytp, 2} 


numeric{p; 2), 
decimalip, 2), 
numberilp, 2} 






p 们 数字， 小 数 点 
后 2 位 














numeric(p, 2), 
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smallnt smallint smallint 
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real, 
smalifloat 














real real real float 








































double double double double 10-38 cw < 1038 

precision, prewision, precision, a 

float, number, float, De double, float, 15 位 精度 ， 或 者 double 
Hoattbp) bp 位 精度 


Hoaribp) float(bp} 


图 A-1 - : 些 重要 的 SQL 数据 类 型 
char(n) 数 据 类 型 是 包含 了 定 长 为 n 个 字符 的 字符 串 。 于 是 ， 在 [3.2.,1] 中 cigd 列 的 数据 类 型 
被 定义 为 char(4) 表 了 示 “c001” 这 样 的 字符 囊 正 好 可 以 放 和 入， 而 “cl1”( 在 我 们 的 表 中 并 没有 这 
样 的 值 ) 的 最 后 将 会 用 空格 填充 ， 即 clAA( 其 中 必 代 表 空 格 字 符 )。 对 于 串 长 度 变 化 很 大 的 列 ， 
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使 用 数据 类 型 varchartn) 可 以 市 首 存 情 空 间 。 例 如 ，ctity 属 性 的 数据 类 型 为 varechar(20)。 它 多 
许 最 太 长 度 为 20 个 字符 的 字符 束 。 这 样 ， 短 字符 串 就 不 需要 很 长 的 空格 串 作 为 结 来。 于 是 ， 
像 “Troy”、 “Austin” 这 样 的 短 城 市 名 占用 比 “OHMahoma City” 或 “San Francisceo” 和 扔 少 的 
存储 空间 。 我 们 使 用 smalhlint 类 型 而 不 使 用 integer 类 型 也 是 出 于 同样 的 考虑 ， 当 整数 值 的 绝对 
但 不 超过 2 =32 767 的 时 候 会 市 约 存 储 空 间 。 

SQL-92、SQL-99 和 各 个 数据 库 产品 都 有 各 自在 图 A-! 所 列 内 容 以 外 的 数据 类 型 。SQL-92 
有 data，tHme、timestamp、[time) interval，natiomal character strings 等 类 型 。SQL-99 (在 其 核 
心 以 外 的 命名 特性 中 ) 有 LARGE OBJECT 或 简称 为 LOB《〈 包 括 BLOB， 二 进 制 大 对 象 ) 和 
Boolean 类 型 ， 以 及 对 每 关系、 用 户 定 人 六、 结 攀 类 型 和 数组 。Core SQL-99 有 distinct 类 型 ， 即 
用 户 为 内 部 类 型 指定 的 同义词 。 在 INFORMIX 中 1yarchar 类 型 允许 最 大 长 度 为 32 767， 俐 
ORACLE 的 long 类 型 支持 最 大 长 度 为 2GB 的 字符 串 。ORACLE 使 用 动态 大 小 的 number(38) 和 
number ( 即 双 精度 { double precision )) 来 实现 更 小 的 SQL 数 据 类 型 smallint 和 real.， 以 上 的 符 
点 数 类 型 的 范围 和 精度 是 简化 了 的 ， 要 知道 详细 的 内 容 请 参考 手册 ， 
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B,1 prompt() 函数 


在 此 附录 中 ， 我 们 将 解释 在 第 5 章 的 很 多 例子 中 都 用 到 的 prompt() 函 数 ， 此 函数 用 来 提示 
与 用 户 的 交互 。 请 参考 图 5-1 后 的 “提示 用 户 交 互 ”小 节 以 获得 在 用 户 只 输入 一 项 的 最 简单 的 
情况 下 该 甸 数 的 使 用 方法 。 一 般 情 况 下 ， 此 提示 函数 输出 作为 第 一 个 参数 给 定 的 提示 字符 串 ， 
然后 从 用 户 丸 输入 一 行文 本 ， 即 用 户 输 入 的 直到 行 尾 《 Ci 语言 中 的 Na' )( 包括 行 尾 ) 的 所 有 内 
容 。 该 函数 解析 该 行文 本 为 由 空白 符 分 也 的 标记 。 空 白 符 和 标记 的 定义 如 下 。 

空白 符 包括 一 个 或 者 多 个 连续 的 空 可 、 跳 格 符 或 换行 符 。 在 C 语 言 中 ， 它 们 一 般 被 相应 地 
表 水 成 :''、Wt 以 及 nn'。 标记 就 是 不 包含 空白 符 的 字符 串 。 一 个 字符 串 中 的 多 个 标记 由 空 牛 
符 分 隔 。 输 人 的 每 一 行 之 间 由 换行 符 分 隔 。 于 是 . 输入 的 一 行 中 的 多 个 标记 是 由 不 包括 换行 
符 的 空白 符 分 隔 的 。 由 于 允许 用 户 在 输 人 换行 符 前 编辑 其 输 人 的 行 的 内 容 ， 所 以 对 于 像 
prompt() 函 数 这 样 的 提示 输入 晴 数 ， 输 入行 作为 处 理 单元 是 很 自然 的 。 

prompt0) 孙 数 能 够 提示 并 从 用 户 的 输入 中 读 入 在 一 行 中 的 指定 数目 的 标记 。 提 示 函 数 的 声 
明 在 图 B-1 的 头 文 件 prompt.h 中 。 它 使 用 了 带 省 略 号 〈… ) 的 特殊 形式 来 支持 不 定数 目的 参 
数 。 你 仍然 可 以 把 它 看 成 如 下 形式 的 晒 数 : 

int prompt (char Prompt Str[].int N, bufl, 1enl，buf2，1enz。，，，， 

第 一 个 参数 prompt_str 是 显示 给 用 户 的 提示 ， 第 二 个 参数 N 是 要 从 用 户 输入 的 行 中 读 人 
的 标记 的 个 数 。 对 接 下 来 的 个 数 不 定 的 参数 对 一 一 buf1l, lenl, buf2, len2,...， 
bufN， lenN 一 一 解释 如 下 : bufK (KK 从 1 到 N ) 是 存放 第 K 个 标记 的 字符 数组 ， 而 lenK 是 


bufH, lenN): 





第 kK 个 标记 对 应 的 字符 数组 所 允许 的 最 大 长 度 。 注 意 ， 所 有 的 标记 都 会 被 prompt() 函 数 读 人 
子 符 数组 。 


i prompt.h: prompted input of one or more tokans on On line of input */ 


int prompt{char prompt[], int ntokens, . .1; 





图 B-1 提示 美文 件 prompt.h 


如 果 有 些 prompt0 函 数 读 人 的 字符 串 变 量 应 该 被 解释 为 int 或 float 型 的 数字 ， 那 么 可 以 使 用 
ANSI 的 标准 C 库 函数 sscanff) 把 串 数 组 转换 为 合适 的 类 型 。 在 转换 时 ，int 型 用 免 d，long int 型 
用 sld，float 型 用 %f，double 型 用 %!f。 下 面 是 一 些 从 图 5-13 中 得 到 的 输入 两 个 字符 串 和 一 个 数 
字 { 为 C 语 言 中 为 类 型 为 double 的 变量 dollars ， 对 应 于 数据 库 中 的 double precision 类 型 的 列 值 ) 
的 代码 ; 


ehar acetfromr1lIi]，aeettor[1ll]i 
double dollars: 
ehar dolliarstr[ll]: 


while (tpromptt"Enter from, to atcounts and dollars for transfer:\n", 
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3. acctfrom, i0, acetto, 10,. dollarstr, 107} < 0) || 
sscanfidol larstr, "SIF" doaTlars) l= 1 { fs convert to double | 
printft"inyalid input. Input example: 345633 #445623 100.45\n™): 
} 


在 sscanf0 函 数 中 dollars 变 量 前 的 && 符 号 用 来 创建 作为 参数 的 指向 该 变量 的 指针 。 这 样 ， 被 调用 的 
函数 就 可 以 修改 变量 的 值 了 。 这 是 Cj 语言 中 利用 非 数 组 类 型 变量 的 函数 参数 给 调用 者 返回 值 的 方法 。 

在 代码 例子 中 使 用 数字 常数 

我 们 的 程序 有 一 个 特别 的 地 方 。 注 意 ， 在 上 面 的 例子 中 对 promptO 的 调用 包含 为 常量 的 参 
数 ， 如 图 $-1 中 对 promptO 曙 数 调 用 时 所 使 用 的 4: 


whilettpromptticid prompt, 1, cust 14d, 47) 3= 由 工 A Mah T1005p, get Cid i 


正如 上 面 所 说 明 的 那样 ，4 代 表 『 了 能 在 数 织 cust_ia 中 放置 的 字符 串 的 最 大 长 度 。 一 般 C 
编程 惯例 要 求 在 此 使 用 符号 常量 ， 而 不 是 直接 常量 4。 于 是 ,在 源 文 件 涉 、 我 们 需要 却 上 .: 


并 define CIDLEN # 


然后 把 对 promptO 的 调用 改 为 ; 


Whji TBtgEPeompttceid 中 prompt。 1 ， cust_id. CIDLENYY 2»= O07} 1{ i  。 - *} 


-en prompt.e: prompted input of ane or more torkens on one Tine of tnrput 
include <stdto.hy - 
inciude <stdarg.hy 
于 fc ?Tutte <string.h> 
QRinelude "prompt.h”" 

并 二 局 下 是 三 二 工料 放 上 区 时 0 
int promptichar prompt_str[j, int ntokens, . . .} 
| 
va_list sp; 
char 1ineLt lMELEN}: 
Char OKenz 
char *tbuffer: 


i bype from stdarg.h 

:* buffer for dnput line 

A token from User input 

r* caller's buffer for token 


下 着 一 痪 种 并] 全 站 ， 二 


tr Bt Tat 上 rg 
An output prompt to user 
Iw et 11ne From user 


va_startlap, ntokenrs],; 
printfi"ks", prompt_str}: 


Faetsr line, LINELEW, stdin): 
For Cie0:f<ntorens:1t+) { 
Jt strtok takes fine the first tfme 1t's calied, OQ after thoat 
和 


return -1: 


tbufter = va_arglap, char *): 
maxlen = voa_argtap, Tntii/ 
1f tstrlienttokeny >» maxleny | 
¥endLapy: 
return -1 : 
} 
strcpyttbuffer. tokeny: 
} 
YA_endrap}: 
return 0Q: 
} 





A Caller's Buffer for Strinmy 
i And Tength or that buffer 
2 Check Tendgth of 本 让 必 上 和 


Ht fall: Userr tOken toOo 1org 


fe return token to caller 


六 UC 


图 B-2 prompt0 函 数 的 源 已 码 ， 详 忻 pronpt.c 


对 于 使 用 大 是 常 量 CIDLEN 的 应 用 程序 ， 在 inceJluae 文 件 中 定义 常量 更 合适 。 这 是 因为 
当 cid 列 的 字符 数 由 于 表 定 义 改 变 而 改变 时 《例如 长 度 从 4 变 为 6)， 相 应 的 定义 也 能 改变 。 于 
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是 我 们 就 很 容易 修 上 改 程序 ， 而 不 需要 搜索 每 个 文件 中 的 4， 然 后 再 根据 上 上 下文 泌 定 是 否 需 要 把 
某 个 4 改 为 6。 在 知道 了 这 点 的 前 提 下 ， 我 们 在 本 书 的 例子 中 并 不 遵守 此 习惯 。 因 为 这 样 能 够 
使 在 上 下 文中 某 个 融 量 的 值 更 显而易见 。 这 并 不 等 于 说 你 可 以 不 遵 宁 好 的 编程 惯例 。 
promptO 范 数 的 代码 在 图 B-2z 中 。 它 利用 了 ANSIC 处 理 不 定 个 数 变 基 的 功能 ， 使 用 在 
stdarg.h 中 定义 的 va_list 类 型 。 请 参考 Brian Kernighan 和 和 Dennis Richie 的 《The C 
Programming Laneuage}》 第 2 版 (Englewood Qliff, NJ: Prentice Hall, 1988 ) 的 7.3 节 。 


B.2 print_dberror(0) 函 数 


为 了 获得 与 SQLERROR 条 件 相 匹配 的 ORACLE 的 错误 消息 ， 我 们 可 以 调用 ORACLE 库 郑 
数 sqlglmU。 注 意 ，sqlgim0 提 供 的 铺 误 消息 并 不 是 以 空 字符 绪 柬 的 。 为 了 使 它 以 空 字符 线束， 
我 们 可 以 利用 在 errsize 中 返回 的 长 度 。 然 后 把 错误 请 息 用 printf#f 印 出 来 ， 姑 贸 B-3 所 示 。 


了 站 print dherrort}--print database error Message. ORACLE case wf 
#define ERRLEN S12 A* max Tength of dr ORACLE error mESSAye 大 






void Print dbarrorit} 
[ 





int errlength = ERRLEN:; ji* size of buffer «yf 
nt errsize:; i to contain actual message lenyth kj 







extern sqlglm(); 








char errbuf[ERRLEN+1]: jx buffer tO receiye Messtge 大 
sqlglmterrbuf, Berrlength, Bertsizel: /* get error WTessagye from ORACLE 是 
errbuf[lerrsize] = “0"; jr make sure it 1s null terminated 二 


白 广 in 二 下 人 第 Sm ,errstze,.errbuft?}: A* print it out 1 







图 B-3 针对 ORACLE 的 print_dberror0) 冰 数 


ji* print dberrort}- -print database error Message, DE2 UDB case 


#incliude <sq1.h»> 
#def ine MAXERRLEN S12 i max length of an error message 


#define LINEWEDTH 72 jx max Characters desired on a 1ine 
extern struct sqlca *sqlca; i reference gliobal SOLCA struct 
yoid print_dberrorty 


{ 
char errbuftlERRLENY: i* buffer to Feteilve MesSae 


int errlent 
1f tterrlen=sqlaintpterrbuf, MAXERRLEN, LINEWNIOTH, &5qlca}) 2 0) 


printft "shin" .errilen, errbuff); 


全 ] 上 汪 尼 


printrf{"No error message provided. SOLCODE = %d, SOLSTATE ™ %sn™, 


sqlca.sqlcode, sqlca.sHlstate); 





图 B-4 针对 DB2 UDB 的 print_dberror0 隙 数 
DB2 UDB 提 供 了 类 侯 的 工具 。 请 参见 图 B-4 的 人 代码。 此外， 你 需要 根据 例 5.1.1 的 解释 修 
疏 Connect 语 句 和 Disconnect 语 句 为 SQL-92 的 形式 。 可 以 参见 附 菜 CC 以 得 到 Connect 语 人 句 和 
Disconnect 语 人 句 的 完整 语法 。 
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B.3 编译 绕 入 式 C 程 序 


如 我 们 在 第 5 章 中 所 说 的 那样 ，C 语 言 织 岸 程序 并 不 认识 髓 在 文件 中 的 EXEC SQL 语 侣 的 
语法 ,所 以 ， 源 文件 一 般 首 先 要 经 过 预 编译 器 的 处 理 。 预 编译 器 把 谋 人 的 语句 转换 成 相应 的 C 
语言 霹 句 。 对 于 不 同 的 系统 ， 预 编译 /编译 过 程 是 不 同 的 ， 下 面 是 两 个 例子 。 

1. ORACLE/UNIX 环 境 下 的 预 编译 /编译 过 程 

人 在 UNIX 环 境 下 ORACLE 版 本 7 和 版 本 8 中 ， 程 序 员 应 首先 创建 名 为 main.pc 的 源 文 件 ， 它 
包含 程序 中 前 C 语 言语 句 和 棣 人 式 SQL (EXEC SQL ) 语句 。 后 缀 .pc 表示 该 文件 是 带 帐 入 式 
SQL 结构 的 源 文 作 。ORACLE 程 序 员 通过 执行 以 下 命令 来 调用 预 编 伴 器 : 

proc inaime=main .pe 

此 命令 将 会 生成 一 个 新 的 文件 main,c。 在 此 文件 中 ， 所 有 的 EXEC sQL 语 名 都 会 被 相应 的 
纯 C 语 铝 蔡 换 。 考 虑 例 5.1.1 中 的 Select 语 句 : 


exec sql select cname,. discnt 1nto :eust_ name, :cust_discnt 
from customers where cid = :cust_id; 


蕊 将 被 一 系列 调用 ORACLE 运 行 期 库 喇 数 替 换 。 在 创建 了 main.cl 以 后 ， 使 用 下 面 的 语句 就 
可 以 编译 该 文件 了 : 

它 将 创建 一 个 名 为 main.o 的 新 的 目标 文件 。 使 用 类 似 的 命令 可 以 编译 前 面 提 到 的 prompt.c 
文件 并 创建 新 文件 prompt.o。 为 了 连接 main.o 和 prompto 为 一 个 可 执行 文件 main， 需 要 执行 : 


ee -a Main main.o 户 FOmpt ,已 $0RACLE HOME/ATiIBAIiIbSgl .a ...<many Tibraries» 


实际 上 ， 专 家 一 般 都 是 创建 一 个 包 合 每 一 步骤 的 make 程 序 的 描述 文件 (makefile)。 有 亲 
make 程 序 的 撒 述 文件 (makefiley， 整 个 连 编 过 程 就 可 以 只 用 一 个 命令 来 完成 了 ， 例 如 make 
E-maine。 最 后 产生 的 可 执行 文件 可 能 要 占用 非常 大 的 磁盘 空间 ， 所 以 限制 目录 下 的 可 执行 文 
件数 目 是 一 个 不 错 的 习惯 。 

注意 ， 数 据 库 系统 一 般 都 带 有 创 程 以 及 相应 的 连 编 过 程 。 它 使 得 在 目录 下 程序 可 以 和 运 
行 数据 库 系 统 所 需 槛 的 可 执行 文件 一 起 工作 。 

2. DB2 UDBAUNIX 和 环境 下 的 预 编译 /编译 过 程 

如 我 们 在 第 5 章 中 所 说 的 孝 样 ，C 语 言 编 译 程序 并 不 认识 散在 文件 中 的 EXEC ”sQL 语 句 。 
所 以 ， 源 文件 一 般 首先 要 经 过 预 编译 器 的 处 理 。 预 编译 器 把 嵌入 的 语句 转换 成 相应 的 C 语 言语 
句 。 对 于 不 同 的 系统 ， 预 编译 /编译 过 程 是 不 同 的 。 

在 UNIX 环 境 下 DB2 UDB 版 本 5 或 者 版 本 6 中 ， 程 序 员 应 首先 创建 各 为 main.sqc 的 源 文 件 。 
它 包 售 程序 中 的 如 语言 语 名 和 能 人 式 SQL (EXEC SQL) 语句。 后缀 .pc 表示 该 文件 是 带 栓 人 式 
SQL 结构 的 源 文 件 。 首 先 使 用 预 编 译 器 prep， 它 以 main.sqc 为 输入 main.c 为 输出 。 此 时 所 有 
的 EXEC SQL 语 何 都 会 被 相应 的 纯 C 语 名 替换 。 考 虑 例 5.1.1 中 的 Select 语 名 : 


EXEC S91 select cname, discnt nto :cust name,. :cust_ discnt 


from customers where cid = :cust_id; 
它 将 被 -- 系 列 调用 DB2 运 行 期 库 的 函数 蔡 换 。 Prep 还 蚀 建 一 个 为 数据 库 在 较 和 层 次 描述 
程序 的 二 进 制 文件 。 可 以 通过 使 用 另 -- 个 DB2 命 令 bina 把 此 二 进 制 文件 提供 给 数据 库 。 通 过 
运行 DB2 肢 本 embprep 就 可 以 完成 这 两 个 步 又 以 及 连接 / 断 开 连接 数据 库 的 动作 。 该 脚本 可 以 
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在 文件 系统 的 samples/c 子 目录 下 找到 。 程 序 员 只 要 提供 正确 的 参数 就 可 以 使 用 此 脚本 了 。 
embprep main [mydbname [username password]] 

缺 省 的 数据 库 名 为 sample， 出 DB2 提 供 的 示例 数据 库 。 你 可 能 不 需要 提供 用 户 名 种 口令， 
这 是 因为 有 些 系 统 使 用 操作 系统 的 权限 来 进行 误 别 用 户 。 

此 时 ， 程 序 还 是 以 .c 的 形式 存在 的 。 可 以 使 用 普通 的 C 编 译 程序 来 把 它 编 译 成 日 标 文件 
main.9。 方 法 如 下 : 

使 用 类 似 的 命令 可 以 编译 前 面 提 到 的 promptc 文 件 ， 并 创建 一 个 新 文件 prompto。 为 了 把 
main,o 和 prompt.o 连 接 为 一 个 可 执行 文件 main， 我 们 需要 使 用 如 下 命令 : 


ec -0 main main.o prompt.o -L$tDB2INSTANCEPATHY /Sq lib/ lib -R ...-1db? 


实际 上 ， 羽 家 一 般 都 为 一 个 节点 创建 一 个 包含 每 一 步骤 的 make 程 序 的 描述 文件 。 在 
samplee 章 了 录 下 有 -一 个 make 程 序 的 描述 文件 可 以 参考 。 有 了 make 程 序 的 描述 文件 ， 蛙 个 连 编 
过 程 就 可 以 只 用 一 条 命令 来 完成 了 ， 例如 make E=main。 

注意 ， 数 据 库 系统 一 般 都 带 有 例 程 以 及 相应 的 连 编 过 程 。 它 负责 在 目 天 中 检查 运行 数据 
库 系 统 所 需 可 执行 文件 。 

你 可 以 直接 读 embprep 脚 本 的 内 容 ， 看 到 它 是 通过 UNIX 命 令 4b2 prep main.sqgc 
bindfile 来 运行 prep 的 。 这 意味 着 brep 是 叫做 db2 的 UNIX 程 序 的 参数 ， 而 不 是 一 个 独立 
的 程序 。 育 怪 的 是 ， 在 运行 4b2 程 序 之 后 ， 对 数据 库 的 连接 仍然 是 打开 着 的 ， 所 以 ,你 可 雇 先 
使 用 ab2 connect mydb， 然后 回 到 UNIX 提 示 符 下 运行 某 些 UNIX 命 令 ， 然 后 骨 使 用 dbp2 
Select piq from products 来 察看 显示 出 来 的 biq。 最 后 ,你 可 以 使 用 db2 coennect 
reset 来 断 开 连接 。empprep 脚 本 就 利用 了 这 种 能 力 。 如 果 休 只 使 用 ab2， 那么 你 可 以 先进 
人 ab2 环 境 【 该 环境 有 自己 的 提示 符 )， 直 到 你 使 用 quit 退出 该 环境 为 止 。 


附录 C SQL 语法 


本 附录 收集 了 本 书 中 出 现 的 标准 的 关系 SQL 语 句 和 对 象 -关系 SQL 语 名 的 语法 (偶尔 也 会 
提 到 用 关系 SQL 语句 处 理 对 象 -关系 功能 )。 这 两 种 语句 分 别 列 在 图 C-1 和 C-2， 但 是 在 文中 是 
按 字 母 顺 序 交 叉 出 现 的 。 此 外 针对 标准 SQL 语句 ， 这 里 还 给 出 了 前 文中 设 提 到 的 一 些 不 同 产 
品 的 SQL 语句 细节 。 

通常 主要 讨论 我 们 所 介绍 的 语句 如 和 何 适 应 于 通用 SQL 的 标准 。3SQL-92 、Core SQL-99 和 
X/Open 中 经 常用 到 的 基本 SQL 和 高 级 SQL 的 语法 主要 在 第 3 意 和 第 5 章 。 

图 C-1 中 所 有 SQL 语 句 都 可 以 内 髋 于 程序 中 。 只 有 Select 有 额外 的 作为 交互 语句 的 功能 : 
可 以 显示 多 行 给 用 户 。 在 珍 人 式 SQL 中 要 处 理 多 行 记录 ， 必 须 使 用 $.1 节 中 提 到 的 游标 。 有 一 
些 语句 一 般 不 作为 交 下 SQL 使 用 ， 如 Commit 语 馈 。 这 些 语 铝 一 般 用 EXEC SQL 开头 ， 而 不 像 
其 他 语句 可 以 知 略 [EXEC SQL]。 


Alter Table 在 已 朋 表 上 增加 或 删除 列 或 约束 
Close Cursor 关闭 游标 
Commit 成 功 提 变 事 务 
Connect 连接 到 数据 库 
Create Index 在 基本 表 上 创建 索引 
Create Schema 创建 模式 来 保存 表 、 视 图 等 
Create Table 创建 基本 表 ! 可 使 用 于 关系 和 对 象 -关系 ) 
Create Tablespace 创建 表 空 间 ( 在 ORACLE 和 DB2 UDB) 
Create Trigger 创建 触发 峰 
Create View 创建 视图 
Declare Cursor 定 必 涂 慰 
Deiete 删除 天 中 行 
Describe 提取 有 关 动 态 准 省 列 的 信息 
Disconnect 断 开 与 数据 库 连 接 
Drop 删除 麦 、 视 图 、 模 式 、 触 发 堪 或 索引 
Exccure 。 执 布 动态 准备 的 语句 
Execute Immediate 执行 宿主 变量 字符 串 中 的 SQL 语 名 
Fetch 从 当前 行 中 提取 值 并 移动 六 标 
Grant 授 耶 表 特权 
Insert 向 表 中 插 信 记录 
Open Cursor 打开 先前 声明 的 洲 标 
Prepare 准备 要 执行 的 动态 SQL 语句 
Revoke 回收 表 特 权 
Rollback 使 事务 到 达 一 个 不 成 功 结论 
Select 从 表 中 检索 数据 

{同时 适应 于 关系 和 对 象 - 关 系 ) 
Update 更 新 表 中 数据 





图 C-] 本 附录 给 出 的 关系 SQL 语句 


图 C-2 主 要 介绍 了 对 象 -关系 和 有 关 的 用 户 定义 函数 语句 。 其 中 ， 没 有 涉及 到 C 中 散人 式 织 
程 ， 如 读 人 对 象 值 到 程序 中 合适 的 结构 变量 中 的 过 程 。 这 样 在 介绍 这 些 语句 时 就 省 略 了 前 缀 
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IEXEC SQL]。 在 ORACLE 中 有 一 个 叫 对 象 类 型 翻译 程序 (OTT )， 可 以 把 Create Type 语 句 转 
化 为 相应 的 C 结 构 声 明 。 通 过 OCICORACLE Call Interface) 提 殿 的 数组 ADT 可 以 访问 C 中 的 幅 
食 表 。ITNFORMIX 也 有 APIR] 以 访问 汇集 中 的 数据 。 


Create Function 
Create Row Type 
Create Table “(同时 适应 于 关系 和 对 象 -关系 情况 ) 


Create Type 
Drop Function 
Drop iRow) Type 





图 C-2 本 附录 给 出 的 对 象 -关系 和 用 户 目 定 儿孙 数 语句 


要 注意 的 是 这 里 省 略 了 一 些 产品 的 特殊 语 杀 。 参 考 产 品 的 SQL 使 用 手册 可 获得 全 部 细节 。 
第 3 章 最 后 列 出 了 ORACLE、DB2 UDB 和 INFORMIX 的 使 用 手册 。 关 于 游标 和 动态 SQL 语句 
的 使 用 可 参考 第 5 章 末尾 列 出 的 时 人 式 SQL 使 用 手册 。 


C.1 AlterTable 语 各 


7.1 节 已 经 介绍 了 Alter Table 语 句 ，ORACLE、DB2 UDB 和 INFORMIX 有 不 同 的 形式 ， 分别 
如 图 7- 了 7、7-8 和 7-9 所 示 。 这 些 格 式 在 图 C-3、C-4 和 C-5 重 新 描述 了 一 下 。Alter Table 允 许 DBA 修 
改 在 Create Table 语 名 中 定义 的 结构 ， 增 加 或 删除 表 中 的 列 ， 同 样 许多 产品 增加 或 删除 约束 。 这 
条 详 句 会 影响 已 经 存在 的 表 中 列 ， 这 样 会 给 数据 存储 带 来 许多 新 的 问题 。Entry SQL-92 中 没有 
提供 Alter Table 语 句 ， 而 在 Core SQL-99 中 只 提供 增加 新 列 的 功能 ， 不 能 删除 旧 的 列 或 增加 、 击 
除 约 束 。Full SQL-99 提 供 所 有 这 些 功能 。XAOpen 的 Alter Table 语 句 只 提供 增加 和 删除 列 功能 。 
所 有 这 些 标准 中 增加 列 的 语法 都 与 DB2 UDB 所 使 用 的 一 样 - 由 于 这 方面 缺少 标准 约定 ， 各 产品 
之 间 差 别 很 大 。 


[EXEC SOL} ALTER TABLE [schema, Jtablename 
[ADD ticolumnname datAatype [DEFAULT {fdefault constant NULL 了 [col_constr fcol_constr...1] 
| table_constr} -- choice of columnname-det. or table_ constr 
E, leol umnname datatype 
[DEFAYULT {default_constant |NULLY] [col_constr {col_constr...}] | table_constr} 
...}1}] -- Zerg Or MOre added columnname-def or table_ constr 
[OROP COLUMN columnname | tcolumnname 4, columnname...}}] 
[MODIFY tcolumnname data-type 
[DEFAULT {default constant|NULLI] [LNOT] NULL] 
{, columnname data-type 
[DEFALLT {default_constant NULE}] [[NOT] NULL] 
...}1] 
[OROP CONSTRAINT constr_name] 
[DRGP PRIMARY KE] 
fdisk storage and other clauses fnot covered)] 
Lany clause above can be repeated, in any order] 
[ENABLE and CISABLE clauses for constraints]; 





图 C-3 ORACLE 中 Aiter Table 语 法 


-一 
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ALTER TABLE [schema. jtablename 
CADD [EOLUMN] columnname datatype 
[DEFAULT {defauTt Constant | NYULLYY [col_constr {col_constr...}] 
CADD table constr] 


[LDROP CONSTRAINT constr_name] 

EDROP PRIMARY KEY] 

[repeated ADD or DROF clauses, 1n any order] 
[disk storage and other cliauses tnot covered}]: 





图 C-4 DB2 UDB 的 Alter Table 语 句 语法 


[EXEC SOL] ALTER TABLE [schema.]tablename 
[ADD new col | tinew_col {, mew_col...}])] 
[DROP columnname | tecelumnname {, columnname...})] 
[ADD CONSTRAINT table, constr | 《tabTe constr {, table_constr...}}] 
EOROP CONSTRAINT constraintname | (iconstraintname {, constraintname...})] 
[repeated ADD or DROP clauses, Tn any order] 


[disk storage and other clauses Aot covered)]; 


约束 单个 列 值 的 new_col 形 式 如 下 : 


columnname datatype 
[DEFAULT {default constant {NULL}Y [eol.constr [cot_constr...}] 





图 C-5 INFORMIX 的 Alter Table 语 句 语法 
ORACLE、DB2 UDB 和 INFORMIX 的 Alter Table 语 向 


ORACLE 产 品 提供 了 许多 特征 ， 包 括 修 改 已 存在 的 列 的 能 力 。 查 找 Alter Table 语 名 的 准确 
语法 可 和 参考 产品 的 SQL 参 考 手 册 。 


C.2 Close Cursor 语 名 


在 所 接 到 的 所 有 标准 和 产品 中 ，Close Cursor 详 句 都 有 如 下 形式 ， 


EXEC SOL CLOSE cursor-name; 
这 条 语句 主要 作用 是 关闭 游标 ， 以 便 不 能 再 访问 活动 记录 .由 于 游标 没有 用 在 专门 的 
SQL 中 ， 所 以 它 总 是 在 程序 中 完成 。 详 细 信 息 参 见 5.4 节 中 的 图 5-12。 


C.3 Commit Work 语 各 
在 所 提 到 的 所 有 标准 和 产品 中 ， 提 交 囊 务 的 语句 都 有 如 下 形式 : 


EXEC SQL COMNIT LWORKI: 


这 条 语句 就 是 成 功 完 成 事务 ， 把 事务 中 所 做 的 所 有 行 的 更 新 永久 记录 到 数据 库 中 ， 并 让 
所 有 用 户 可 以 看 到 这 个 结果 ， 园 数 据 特权 一 致 。 详 细 信 息 参 见 5.4 节 。 


C.4 Connect 语 各 


Connect 语 句 主要 用 在 艇 和信 式 SQL 中 和 次 与 数据 库 建 立 连 接 的 时 候 。 在 交互 式 SQL 中 ,出 
用 户 界 画 来 为 用 户 会 话 完成 与 数据 库 的 连接 。 在 Entry SQL-92 或 Core SQL-99 中 都 没有 
Connect 和 Disconnect 语 句 ; 这 样 允 许 生 产 广 商 自 由 指定 需要 什么 ， 数据库 服务 器 、 数 据 库 、 
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用 记名 、 口令 、 授 权 服 务 占 等 等 。Full SQL-99 中 的 语法 如 下 : 

EXEC SQL CONNECT TO target- server [AS connect-name] [USER usernamel]: 

或 

EXEC SQL CONNECT TO DEFAULT: 

这 里 target-server 是 由 实现 时 决定 的 (不 是 由 SQL-99 定 义 ， 而 是 由 生产 厂商 定义 
connect-name 是 将 来 引用 这 一 连接 的 标 况 符 ， 特 别 是 这 一 连接 是 你 所 拥有 的 几 个 连接 中 的 
一 个 的 时 慨 。 

在 X/Open 标准 中 还 有 一 个 附加 的 USING 子 句 . 


EXEC SOL CONNECT TO target-server [AS connect-name] 
TUSER username [USING authernticationl]; 


或 
EXEC SOL CONNECT TO DEFAULT; 


在 ORACLE 中 连接 的 基本 艇 入 式 SQL 语 句 是 : 


EXEC SOL CONNECT :user name IDENTIFIED BY :user_pwd: 
注意 ， 在 SQL 语 铝 中 的 冒号 表示 宿主 变量 。DB2 UDB 使 用 Full SQL-99 标 准 ， 并 且 人 允许 在 用 OS 
用 户 名 来 标识 用 户 时 第 一 种 形式 中 不 带 USER 于 急 。INFORMIX 使 用 X/Open 有 形式。 详细 信息 参见 


5,1 节 。 
C.5 Create Function 语 和 名 ( UDF ) 


只 有 SQL-99 中 指定 SQL 中 用 户 定 闵 函 数 的 调用 。 其 中 Create Function 语 句 给 出 了 许多 选 
项 ， 图 C-6 给 出 了 最 主要 的 选项 。 它 与 Create Procedare 语 句 很 相似 ， 只 是 过 程 没 有 返回 值 。 


CREATE FUNCTIOGN Cschema. Jfuntionname {Lparam {, param ...}]) 
RETURNS datatype 
[LANGUAGE SQLICIFORTRANICOBOL] -= or some others, but not Java 《Yet 1 
[NO SOLICONTAITNS SOL| READS SQL DATA | MODIFIES SQL DATA] 


{executable. SOL statement “- for SOLAPSM function 
| EXTERNAL MAME external_function_ name} -- Tor external functtion 





param :: 一 [INIOUTIINOUTY parammame datatype 


图 C-6 Core SQL-99 的 Create Function 请 句 语 法 ( 部分) 


目前 有 两 种 UDE，、 一 种 是 看 刍 过 程 ， 主 要 用 可 在 数据 库 服务 器 上 安全 运行 的 语 高 开发 
( 一般 是 Procedural SQL )、 另 一 种 是 外 部 函数 ， 可 用 已 或 其 他 语言 开发 。 

在 Create Function 请 句 选 择 LANGUAGE SQL 定义 该 函数 为 SQL 函 数 ， 连 同 它 的 代码 ， 存 
储 在 数据 库 服务 器 上 ， 也 就 成 为 了 存储 过 程 。SQL 函 数 中 可 以 有 可 执行 的 SQL 语 同 。 这 些 可 
披 行 语句 (executabte_SQL_statemenD 可 以 是 SQLAPSM ( SQL-99 的 过 程式 SQL 语言 中 永久 性 存 
储 模 块 ) 中 的 形 如 BEGIN ... END 的 复合 语句 。 因 此 可 用 PSM 的 代码 块 (PSM_Code_blocK) 来 取 
代 可 执行 SQL 语句 (executable_SQL_statement。 关 于 SQL 图 数 的 例子 参见 4.4P ， 那 里 的 过 程 
性 SQL 语言 对 于 ORACLE 使 用 PLVSQL 而 INFORMIX 使 用 SPL 。 

另 一 方面 ， 在 Greate Function 语 句 中 如 选用 其 他 语言 ， 如 LANGUAGE C， 则 可 以 定义 外 
部 函 教 ， 当 然 它 需要 EXTERNAL NAME 子 名 来 指明 代码 放 在 哪个 文件 (在 服务 器 以 外 ) 中 。 
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注意 ， 对 于 通过 SQL 访问 或 避免 访问 数据 库 数 据 的 外 部 函数 要 进行 保护 。 详 细 信 息 参 见 4.5 节 。 
ORACLE 的 语法 同 图 C-6 的 Core SQL-99 很 类 似 ， 并 有 图 C-7 中 的 重要 子 句 。 在 某 些 库 文件 
中 这 种 形式 可 以 定义 PTEASQL 函数 或 外 部 C 范 数 。 关 于 前 者 的 例子 参见 4.4.1 季 。 


CREATE [OR REPLACEY FUNCTION Tschema. Tuntionname 
{Coparam {, oparam ...1]) 
RETURN datatype IS 
{PLASOL code_block -* for PLASAL function 


| EXTERNAL LIBRARY 1ibname LNAME ext_functionnamel} -~ for external UDF 





oparam ;+= parammname FINIOUTIIN OUT] datatype 
图 C-7 ORACLE 的 Create Function 语 襄 语 法 (部 全 ) 


INFORMIX 用 来 定义 SPL 了 疼 数 或 庆 部 忆 图 数 的 语法 轿 有 点 不 同 ， 如 图 C-8 所 未 。 在 
ORACLE 和 INFORMIX 产 品 中 ， 外 部 函数 可 使 用 C 语 言 代码 来 访问 数据 库 . 这 两 种 产品 的 外 部 
阔 数 中 也 可 以 使 用 Java 鸽 言 。 


CREATE [OR REPLACET FUNCTION [sthema.Jfuntionname 
(Ciparam {. iparam ...}1} 
RETURN datatype 1 
{PL/SOL_code_block -- for SPL function 


|EXTERMAL LIBRARY 11braryname CNAME ext_functionnamel}: -- or external WDF 


iparam ::™= paramname LIN|OUTIIN OUT] datatype 





图 C-8 INFORMIX 的 Create Function 语 名 语法 (部 分 ) 


DB2 UDB 中 没有 过 程 性 语言 。 它 用 Create Funetion 来 声明 外 部 C 或 Jaya 图 数 . 它 的 诸 法 与 
SQL-99 的 语法 非常 接近 。 因 为 外 部 范 数 中 不 能 使 用 SQL 语 名 ( 这 是 一 个 很 严重 的 限制 )， 所 以 
带 有 No SQL。 外 部 函数 主要 用 于 单个 列 值 的 操作 。 此 外 ， 用 RETURNS TABLE 苦 代 
“RETURNS datatype” 的 Create Function 可 以 定义 表 函 数 。 表 函数 是 用 C 或 Java 实 现 的 . 用 来 
把 非 数 据 库 中 数据 导 人 SQL 可 引用 的 虚 表 中 。 


C.6 Create |ndex 语 各 


第 8 章 介 绍 的 Create Index 语 句 有 许多 不 同 的 上 形式， 如 图 8-1 (XiOQpen )、 图 8-7 和 8-14 
(ORACLE )、 图 8-15 和 8-20 ( DB2 UDB )。 这 些 产品 的 Create Index 语 法 现 整 理 在 图 C-9 和 图 C-10 中 。 
下 面 是 XiOpen 中 关于 Create IJndex 语 名 的 标准 说 明 ( SQL-99 中 没有 提 到 Create lndex 
语句 ): 
CEXEC SOL] CREATE EUNIOUE] INDEX Eschema,]indexname 
ON tablename (eolimnname [ASC | BESC] {, columname LASC |DESC]...11: 


ORACLE、DB2 UDB 和 INFORMIX 都 支持 这 种 标准 。 每 个 产品 都 对 语法 进行 了 扩充 以 指 
定 其 他 信息 ， 如 索引 存 情 在 什么 地 方 、 创 建 什 么 样 的 索引 以 及 如 何 递增 存储 索引 | 。 


1. ORACLE 的 Create Index 语 各 
ORACLE 的 Create index 语 名 语法 如 图 C-9 所 示 。TABLESPACE 子 句 用 来 指定 创建 的 索引 要 
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仓储 的 表 空 间 。ORACLE 数 据 存储 结 术 示意 图 参见 图 8-3。 几 8-4 后 次 的 文字 介绍 了 STORAGE 子 
侣 的 作用 。NOSORT 选 项 前 介绍 在 图 8-7 后 面 ， 而 PCTFREE 子 名 的 介绍 在 图 8-14 后 面 。 


[EXEC SALY CREATE CUNTOUE | BITMAP] INDEX [schema. jindexname ON [schema, ltablename 
tcolumnname [AoE | DESC] {, eolummnrname [ASC | CDESCI}} 
[TABLESPACE tblspacename] 
[STORAGE CLINITIAL wm EKIMH]] CNEXT nr CR|IMIF EMINEXTENTS nm] CHAXEXTENTS nm] 


LPETINCREASE ni} ) ] 
[PCTFREE n] 
[other disk storage and transacttonal clauses not covrvered] 
[NOSORT] 





图 C9 ORACLE 的 Create Inttex 语 后 请 法 


[EXEC SQL] CREATE LUNIOUET IiNDEX Tndexname ON [schema.1tablename 
eolumnname LASC | DESC] {f, columnname TASC | DESCI..,,1} 
LINGCCUDE teoTumnnAame CASC | BESC] {, tolumnname [ASC | DESCY...1)] 
【CLUSTER 了 ， 


[PLTFREE nm] 
LMINPCTUSED mj 
[ALLOW REYERSE SCANS]: 





图 C-10 DB2 UDB 的 Create Jndex 语 句 语 法 


2. DB2 UDB 的 Create Index 话 各 

DB2 UPDB 的 Create Index 语 名 语法 如 图 C-10 所 示 。 图 8-15 后 面 的 讨论 详细 介绍 了 图 C-10 的 
各 个 选项 . 

和 DB2 UDB 一 样 ，INFORMIX 支持 CLUSTER 索 引 。 和 和 ORACLE 一 样 ， 它 也 允许 索引 的 
位 置 在 日 己 的 磁盘 区 域内 (在 INFORMIX 中 称 为 库 空间 ， 而 在 ORACLE 中 称 为 表 空 间 )。 此 外 
INFORMIX 带 有 DataBlades 提 供 的 访问 方法 的 索引 ， 如 地 理 数 据 的 两 维 索 引 。 

3. 对 时 -关系 的 考虑 

ORACLE 人 允许 索引 使 用 对 象 的 任何 属性 ， 但 是 要 求 用 以 表 和 名 开始 的 带 点 表达 式 来 指明 。 
使 用 Create Index 中 STORE AS 子 句 指 定 的 表 儿 也 允许 世 套 表 的 索引 .INFORMIX 人 允许 使 用 行 
类 型 列 或 询 的 函数 值 作为 索引 列 。 但 是 ，INFORMIX 不 允许 行 类 型 列 中 的 字段 单独 出 现 作为 
索引 中 列 名 。 因 为 例 4.2.23 中 WHERE 子 句 的 字段 名 是 例 4.2.20 中 行 类 型 定义 的 字段 中 的 字段 ， 
所 以 它 不 能 作为 列 被 索引 。 因 为 主键 一 定 是 要 建 索引 和 的， 所 以 表 列 中 的 字段 不 能 为 主键 。 


C.7 Create Row Type 语 名 


用 户 自 定义 结构 类 型 ， 在 ORACLE 中 称 为 对 象 类 型 而 在 INFORMIX 中 称 为 行 类 型 ， 可 用 
如 下 语句 创建 : 


CREATE RoW TYPE rowtype 
(fieldname datatype [NOT NULLI]{,. fieldname datatype CNOT NULL] ...1+} 


LUNDER supertypel]: 


可 在 本 附录 中 查看 SQL-99 中 相应 和 的 Create Type 语法 。 关 于 行 类 型 的 更 雪人 信息 参见 
4.2.2 节 。 
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C.8 Create Schema 语句 


Core SQL-99 中 的 模式 主要 是 针对 单个 用 户 来 讲 的 ， 它 就 是 指 表 、 索 引 和 一 些 其 他 相关 数 
据 库 对 象 的 集合 。 数 据 库 目录 中 表 的 全 名 是 模式 名 . 表 名 ( schemaname .tablename， 模式 
名 往往 是 用 户 名 }， 其 他 数据 库 对 象 也 是 如 此 。 更 多 信息 参见 7.4 节 。 

以 下 是 SQL-99 的 Create Schemai 语 句 的 主要 语法 。 在 Core SQL-99 中 可 以 为 新 的 模式 名 指 
定 明 确 的 名 字 。PDPBA 可 用 AUTHORIZATION 子 全 为 用 户 设 置 一 个 寞 式 ， 让 模式 名 缺 省 为 
authorization id, 通常 为 用 户 名 字 。 


[EXEC SOL] CREATE SCHEMA 
{sthemename -- to Speacify explicitly: not CoOre SOL-Go 


| AUTHORIZATION authorization_1d} -- default schemaname 1s authorization_itd 
[Ischema_element schema_element ...}]; 


XIOpen 有 相同 的 语法， 并 有 秆 外 一 个 选项 用 来 指明 字符 集 。 在 Core SQL-99 和 XiOpen 中 可 
选 的 模 蕊 元素 (schema_elements) 是 用 来 创建 数据 库 对 得 的 SQL 语 句 : Create Table, Create View, 
Create Index 和 Grant。 它 们 一 般 给 新 的 复式 提供 初始 内 容 。 这 里 所 涉及 到 的 三 个 产品 中 ， 只 有 
DB2 UDB 人 允许 用 户 用 显 式 指 定 的 模式 名 创建 附加 的 命令 模式 。 这 三 个 产品 都 支持 Core SQL-99。 


C.9 Create Table 语 向 


7.1 节 介绍 了 Create Taple 语 句 的 基本 SQL 形式 ， 使 用 了 ORACLE、DB2 UDB 和 
INFORMIX 的 通用 语法 ， 如 图 C-11 所 示 。 


[EXEC SOL] CREATE TABLE [Lschema. Jtablename 
(Icolumnname datatype [DEFAULT (defauit, constant| NULL}] feol_constr icol_constr... 
| tabte constr} -- choice of either columname-definition or table_constr 
{, (tol umnname datatype COEFAULT fdefault_constant [NULL}Y] feol_ceonstr {col_constr... 


| table_constrl 
.1); -- zero or More additional columnname-deéef or tabile constr 


约束 单个 列 值 的 Col_const 撒 式 如 下 : 
{NOT NULL | -- this 4s the First of a Set of hotices 
[CONSTRAINT constraintname} -- Ff later choices used, optionally name constraint 


UNIQUE -- the rest of the choices start here 
| PRIMARY KEY 
| CHECK search_cond?} 
| REFERENCES tablename L{columnname}] 
[ON DELETE CASCADET] 


约束 多 个 别 值 的 table_const 形 式 如 下 ， 


[CONSTRAINT corstraintname] 
[UNIOUE Ceolumnname ff, columnname...}) -- choose one of these Clauses 
| PRIMARY KEY tcolumnname 41, columnname...}) 
| CHECK tsearch_condition; 
fF FOREIGN KEY (eolumnname 4, columnname,..1) -- folilowing is all bne clause 
REFERENCES tablename [icolumnname {, columnriame...}}] 
[ON DELETE CAStCADED]} 





图 C-1i Create Table 语 名 的 基本 SQL 语法 
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ORACLE、DB2 UDB 和 INFORMIX 都 接受 基本 SQL 语法 ， 除 了 在 INFORMIX 中 需要 所 有 
的 列 定义 在 表 约 束 定义 之 前 ， 而 基本 SQL 语 法 中 是 允许 列 定 疼 和 表 约 束 定义 以 任何 次 序 出 现 。 
这 些 子 句 的 讨论 参见 7.1 节 。 

1. ORACLE 的 Create Table 语 身 

ORACLE 的 Create Table 语 法 如 图 C-12 所 示 ， 在 前 面 图 8-5( 除 了 CLUSTER 子 句 } 和 图 8-22(CLUSTER 
于 分 ) 中 也 已 经 提 到 过 。 它 的 前 四 行 语法 与 基本 SQL 请 法 一 样 。 


[EXEC SOL] CREATE TABLE [schema,. Jtablename 
{columnname datatype [OEFAULT {default_constant NULL}] [eol constr [Leol_constr,..}] 


| table_constrl - choice of either columnname-definttiorn or table constr 


， {columnname trepeat DEFAULT clause and col_constr 11st) | table_constr}...}} 
-for tabile in cluster 


[CLUSTER clustername tcolumnname [, colummname ...1)} 
| {{QORGANIZATION HEAP | ORGANIZATION INDEX (this tas Clauses not covered)] 


[TABLESPACE tblspacename} 
[STORAGE ¢CINITIAL n CKIMIY CNEXT n [K|M]] [MINEXFTENTS ny CMAXEXTENTS Cr | UNLIMITED}] 


EPCTINGREASE my fadditi1onal STORAGE ptions not covered’)] 


[PCTFREE nm] [PETUSED nj 
[disk storage and other ciauses (not covered}] 1 


[AS subquery] 





图 C-12 ORACLE 的 Create Tahle 语 句 语 法 


注意 最 后 一 行 的 AS supquery， 这 个 标准 的 扩展 允许 Create Table 诸 句 指定 插入 到 新 去 
中 的 行 。5STORAGE 子 句 在 图 8-4 后 面 说 明 ， 而 PCTFREE 和 PCTUSED 子 名 在 图 8-5 后 面 说 明 。 

2. DB2 UDB 中 人 Create Table 语 向 

DB2 UDB 的 Create Table 语 句 (图 C-13 ) 与 ORACLE 形式 相 比 有 较 详 细 的 存储 说 明和 
ORACLE 一 样 ， 在 命名 的 表 空间 内 指定 表 的 位 置 ， 而 表 空 间 可 以 通过 存储 说 明 来 建立 ， 这 方 
面 信息 参见 本 附录 的 Create Tablespace 语 句 。 


{EXEC SOL] CREATE TABLE [sehema, Jtablename 
t{cotumnname tatatype CDEFAULT {default_constant|HULL)] 
feol _constr {eol_constr,,.}]| table constr} 
{, [columnname datatype [CDEFAULT {default_constent tNULLt] 


[eol_constr {col_constr...1]| table constr}l...}) 
[IN tblspacername [INDEX IN tblespacename]] 


[HOT LOGGED INITIALLY] 
fdisk storage snd other clauses tnot covered)] 





图 C-13 DB2 UDB 的 Create Table 语句 语法 


INEORMIX 的 Create Table 语 句 有 一 个 IN dbspace 子 句 而 ORACLE 和 DB2 UDB 有 IN tablespace 
于 句 数 指定 磁盘 存储 的 特定 单元 中 表 的 位 置 。 它 也 可 以 指定 第 一 个 及 其 后 的 扩展 的 大 小 ， 也 就 是 磁 
盘 分 配 单元 的 大小。 

3. 对 象 一 关系 语法 

带 有 对 象 -关系 扩展 的 Create Table 语 句 语法 如 图 C-14 所 示 。 如 果 表 各 后 面 有 OF typename， 
则 这 表 就 是 对 每 表 ， 否 则 它 就 是 关系 表 。 所 有 关系 表 的 存储 子 句 同样 也 适用 对 象 表 。 表 的 率 簇 
与 索引 结构 中 的 成 员 的 特殊 选项 只 局 限于 关系 表 中 。 在 column_defi 理 法 表明 数据 类 型 是 可 选 的 ， 
但 是 在 其 他 部 分 都 没有 指定 数据 类 型 即 对 于 关系 表 设 有 AS 子 查询 子 铝 的 情 次 下 ， 却 必须 指明 数 


= 一 一 -一 一 到 atrr 1 


542 数据 笠原 型 、， 策 往 与 星 能 





据 类 型 。 如 果 数 据 类 型 已 用 对 象 类 型 或 子 查询 指明 了 ，、 则 可 在 column_def 中 忽略 数据 类 型 。 


[EXEC SQL 了 CREATE TABLE [schema. Jtablename 
LOF [Lschema. ltypename] -- for obiect tables 
teolumn_def | table constr | table_ref_clause 


{, column_def | table constr | table_ref_ clause --.]) 
{CLUSTER clustername tcolumnname [, columnname ...})} -- Tot for object tables 
| ( [ORGANTIZATION HEAP | ORGANIZATION INDEX] ~- Not for object tables 
[TASBLESPACE tblspacename] 
LSTORAGE [INITIAL n CKIM]] [NEXT nm CK|MI] 【MINEXTENTS n] 
[MAXEXTENTS {rm | UNLIMITED13 [PCTTNCREASE m]7] 
[PETFREE mn] [PCETUSED 六 了 
[NESTED TABLE columnname STORE £5 tablename 
(. NESTED TABLE tolumnname STORE 上 AS tablename...}] 
[AS subquery]; 


etlumn_def : ;一 
columnname [datatype} [DEFAULT {default_constant |NULL}] - -SB discussion 
Leol_constr {col_constr...}] 
table_ref_clauUse 二 :到 
SLOPE FOR {columnname | dotted expry 工 号 [schema. ]tebiename 





图 C-14 ORACLE 中 带 有 对 象 - 关 系 扩展 的 Create Table 语 宫 的 语法 


在 INFORMIX 中 Create Typed Table 语 名 可 以 不 用 能 套 表 子 句 或 范围 子 句 ， 而 且 它 还 可 以 
处 理 类 型 定 当 的 空 列 。 其 他 列 的 约束 可 当做 表 约 束 处 理 ， 并 不 提供 列 的 缺 省 值 。 它 也 提供 一 
些 存 储 说 明 ， 来 贤 补 对 于 类 型 者 语法 过 于 简单 的 不 足 ， 如 图 C-15 所 未 。 


[EXEC SQL] CREATE TABLE [schema. ltablename 
OF TYPE row typename { table constr {, table constr ...})} 
LIN tbspace] [EXTENT SIZE mn KBS] CNEXT siTze nn KB] 
【UNDER supertablenamel]: 





图 C-15 INFORMIX 的 Create Typed Table 语 凶 详 法 


C.10 ORACLE 和 DB2 UDB 的 Create Tablespace 语 向 


Create Tablespace 不 出 现在 任何 标准 中 。 表 空间 为 用 户 提供 一 种 修改 数据 库 的 缺 省 设置 以 
及 充分 使 用 磁盘 资源 的 方法 。ORACLE 的 Create Tablespace 语 他 语法 如 图 C-16 (或 图 8-4) 所 
示 。 关 于 QRACLE 中 存储 结构 元 素 的 更 完整 的 描述 参见 8.2 节 ， 其 结构 图 在 图 8-3 中 。 


[EXEC SOL] CREATE TABLESPACE tblspacename 
DATAFTLE ‘filename” [SIZE nr CEIM]] [CREUSE] [AUTOEXTEND OFF 
| AUTOEXTEND ON CNEXT n CKIM] [MAXSIZE LUNLINITED |n CK|IMII] 
{. filename' (repeat SIZE, REUSE, 3nd AUTDEXTEND options) . . . 
- the following optional clauses can Come in any order 


LONLINE | OFFLINE] 
[DEFAULT STORAGE CCINITIAL nj CNEXT nm] THINEXTENTS ny CMAXEXTENTS {n|WNLIMITED}] 
[PETINCREASE my》 tadditional DEFAULT STORAGE options not COVAred YY] 


[HINIMUM EXTENT nm EK|M]] 
[ather optional clauses not Coverted]; 





图 C-16 ORACLE 的 Create Tablespace 语 句 语 法 
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DB2 UDB 的 Create Tablespace 语 句 语法 在 图 C-17。DB2 UDB 支 持 两 种 表 空 间 : 系统 管理 表 
空间 和 数据 库 管 理 表 空间 。 系 统管 理 表 空 间 由 操作 系统 的 文件 系统 来 管理 ， 而 数据 库 管 理 表 空 
回 不 用 文件 系统 管理 而 由 数据 库 系 统 直接 管理 磁盘 。 对 于 小 型 数据 库 ， 可 用 系统 管理 表 空 间 来 
简化 创建 和 管理 操作 ， 而 对 高 性 能 应 用 程序 ， 则 经 常 需要 数据 库 管 理 表 空间 的 额外 工作 。 


[EXEC SOL] CREATE TABLESPACE tbl spacename 
MANAGED BY 
{SYSTEM USTING “filename’ npages -- system-managed space 


|DATABASE USING {FILEIDEVICE} ‘containername']) -- or database Managed space 
[EXTENTSIZE npages] COWYERHEAD nmillisecs] [TRANSFERRATE nmillisecs]: 





图 C-17 DB2 UDB 的 Create Tablespace 语 条 语法 


在 ORACLE 中 EXTENTSIZE 用 来 指定 磁盘 分 配 单元 的 大 小 。 可 选 参 数 DVERHEAD 和 
TRANSFERRATE 用 来 站 查询 优化 器 提供 磁盘 速度 信息 。OVERHEAD 是 以 微 秒 为 单位 的 开始 
IO 操作 的 时 间 ， 而 TRANSFERRATE 是 读 一 个 4KB 责 面 到 内 存 所 花 的 时 间 的 估计 。 

DRACLE 和 DB2 UDB 都 提供 Alter Tablespace 语 句 用 来 修改 已 创建 的 表 空 间 ， 主 要 是 如 和 人 
昌 多 的 磁盘 存储 紫 ， 并 可 几 Drop Tablespace 删 除 表 空 间 。 因 为 表 空 间 主 要 是 指定 如 何 实现 数 
据 库 ， 而 不 是 一 个 服务 ， 所 以 我 们 所 提 到 的 标准 中 没有 一 个 标准 规定 表 空 间 的 命令 。 

INRORMIX 设 有 Create Tablespace 语 句 。 取 和 而 代 之 ， 它 使 用 一 种 类 似 的 磁盘 空间 单元 也 就 
是 库 空 间 。 可 用 图 形 化 管理 牲 序 ON-monitor 或 系统 程序 “onspaces” 创 建 一 个 库 空间 。 


C.11 Create Trigger 说 各 


触发 器 就 是 存储 在 数据 库 上 ( 即 存储 在 数据 库 模 式 中 ) 并 当 某 表 上 发 生 革 些 事件 如 揪 人 、 晋 
除 或 更 新 时 运行 的 代码 序列 。SQL-92 中 还 没有 定义 触发 器 的 标准 ， 而 SQL-99 的 Create Trigger 
后 何 博 法 如 图 C-18 所 示 。 虽 然 Core SQL-99 中 也 没有 触发 髓 的 标准 ， 但 它 是 称 为 基本 触发 器 功 
能 的 附加 特征 ， 它 只 少 了 FOR EACH STATEMENT 子 句 ， 它 被 给 了 另外 一 个 特征 标识 为 扩展 
触发 器 功能 。 由 于 几 种 主要 的 数据 库 产 品 都 按 标准 实现 了 触发 器 (从 1990 年 开始 }， 所 以 下 面 
就 分 别 对 它们 进行 介绍 (来 自 图 7-10)， 


[EXEC SQL] CREATE TRIGGER Lschema, Jtrigger_name {BEFORE | AFTER} 
{INSERT | DELETE | UPDATE [OF columnname {, colummnname...}]! 
ON tablename [REFERENCING corr_name_def {, corr_name def...1] 
[FOR EACH ROW | FOR EACH STATEMENT] 
[WHEN tsearch condittion}] 
{statement -- action tsingle statement} 
| BEGIN ATOMIC statement; { statement;,..} END}: -- action (multiple statements 


定 兴 丰美 名 的 Corr_name_ def 形式 如 下 ， 


{OLD [ROW 了 [CAS old_row_corr_name 

| NEW [ROW] [AS] new_ row_corr name 

| OLD TABLE [AS] old table corr_name 
| NEW TABLE [AS] new table corr_namel} 





图 C-18 SQL-99 的 Create Triggeri 秋 名 语法 
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Create Trigger 语 名 创建 一 个 命名 为 trigger_name 的 对 象 ， 这 个 名 字 可 出 现在 出 错 消息 
中 并 可 在 以 后 删除 触发 器 (Drop trigger_name) 时 使 用 。 在 通过 表 名 给 定 表 上 指定 事件 
( 某 组 字段 集 的 INSERT、UPDPATE 或 DELETE) 发 生 之 前 或 之 后 触发 器 被 触发 。 

DB2 UPB 的 Create Trigger 语 句 如 图 C-19 所 示 ， 它 与 SQL-99 标 准 非 常 接近 。 


[EXER SOE] CREATE TRIGGER Tsehema. J]trigger Name 
{NO ChaSCADE BEFORE | AFTER) 
{INSERT | DELETE | UPDATE [OF columnname {, columnname, ..1]} 
DH tablename [REFERENCING corr_name_def 二。 corr_name def..,.}} 


{FOR EACH ROW | FOR EACH STATEMENT} MODE DA2SOL 
[WHEN {search_condition’}] 
{ 5tAtement 
| BEGIN ATOMIC statemeant;: {statement:...} ENDY: 





图 C-19 DB2 UDB 的 Create Trigger 襄 名 语法 


由 于 QRACLE 的 Create Trigger 语 句 是 在 标准 制订 以 前 完成 的 ， 所 以 它 与 标准 有 较 大 的 差 
别 。 它 的 语法 如 图 C-20 所 示 。 


[EXEC SO0L] CREATE [OR REPLACE] TRIGGER trigger. name 
fBEFORE | AFTER | TNSTEAD OF] 
{INSERT | DELETE | UFDATE [OF columnname [, columnname...}1] 
ON tabhlename LREFERENCING corr_nome_def {, Corr Name.def.,..}]} 
{FOR EACH ROW | FOR EACH STATEMENT} 
[WHEN search_condftion}] 
BEBIN statement lstatement;..,.} END: 


提供 行 相 关 洛 的 Corr_name_def 如 下 ，; 


{OLD old_row_ corr, name 
[NEW new_row_corr.namel 





图 C-20 ORACLE 的 Create Trigger 下 名 语 法 


INFORMIX 的 Create Trigger 语 名 语法 与 SQL-99 也 非常 相近 。 
C.12 _ Create Type 语句 


在 SQL-99 中 Create Type 语句 用 于 创建 用 户 自 定义 类 型 ， 目 前 有 两 种 类 型 ， 结构 类 型 和 特 
殊 (distinct) 光 型 。 特 殊 类 型 只 是 给 一 种 类 型 起 了 另 一 个 名 字 而 已 ， 其 中 源 类 型 可 以 是 任 何 内 
部 兴 型 ， 如 数字 、 字 符 串 或 BLOB。 但 是 特殊 类 型 的 项 目 如 不 经 过 转换 则 不 能 与 源 类 型 的 项 目 
比较 。Core SQL-99 便 建 一 个 特殊 类 型 的 最 简单 语句 如 下 ， 
CREATE TYPE distinct typename AS SOUrce typename FINAL; 


在 DB2 UDB 和 INFORMIX 中 ， 特 殊 类 型 可 用 以 下 语句 创建 : 


CREATE DISTINCT TYPE distinct typename PS sOUrce typPename: 
DB2 UDB 允 许 使 用 任何 内 部 类 瑞 作 为 源 类 型 ，INFORMIX 则 允许 任何 内 部 类 型 、 行 类 型 
威 男 一 个 特殊 类 型 ， 而 在 ORACLE 中 则 没有 特殊 类 刑 。 注 意 特 殊 类 型 可 很 自然 地 用 在 纯 关 系 


数据 库 设 计 中 。 
结构 用 户 定义 类 型 是 SQL-99 中 一 个 命名 特征 的 扩展 ， 用 于 定义 一 个 UDT 重 要 子 句 的 语法 


如 图 C-21 所 示 。 


岩 肛 中 SOL 请 洁 S45 


CREATE TYPE Cschema., Jtypename [LUNDER] typenaie £5 
tattrname datatype {, attrname datatype ...}1) -- attribute Tist 
{TINAL NOT FINAL]) 


INSTANCE METHOD methodname Fliparamname type {, Paramname type ...}»] 
RETURNS datatype 

{, INSTANCE METHOD methodname Liparamname type tf. Paramname type ...}1] 
RETURNS datatype ,..1]; 





图 C-21 SQL-99 的 创建 用 户 自 定 义 类 型 语 馈 语法 (结构 ) 


这 里 UNDER 可 选项 可 用 于 定义 继承 层次 中 子 类 型 。 结尾 子 句 用 十 定义 这 种 类 型 在 类 型 层 
次 中 是 否 是 一 个 超 类 。 
在 ORACLE 中 ，Create Type 语句 创建 的 结构 类 卉 ， 称 为 对 象 类 型 ， 如 图 C-22 所 示 - 


CREATE [OR REPLACEY TYPE [schaema, Jtypename AS OBJECT 
tattrname datatype {, attrname datatyps ...} 
MEMBER FUNCTION methodname [{param type |. param type ...})1 
RETURN datatype. 
[MEMBER FUNCTION methodname ftparam type [,. param type .-。] 
RETURYN datatype, . 、. 


PRAGMA RESTRICT_REFERENCES (DEFAULT, RNOS, WNDS, RNPS, WNPS) 


); 

CREATE [OR REPLACET TYPE fschema. Jtypename -- incomplete type 
CREATE TYPE typename AS TABLE OF datatype:; -- Tested table 
CREATE TYPE typename AS YARRAY max_elements) OF datatype: -~ VARRAY 





图 C-22 ORACLE 的 Create Type 语句 语法 


关于 成 员 曾 数 实 现 的 更 多 信息 参见 4.4.1 节 。 在 INFORMIX 中 用 户 自 定义 的 结构 类 型 称 为 
行 类 型 ， 可 用 Create Row Type 语句 来 创建 ， 该 语句 也 被 列 在 本 附 订 中 。 

DB2 UDB 世 提供 结构 的 UDT， 但 是 不 能 用 于 一 般 的 列 值 类 型 中 。 数 据 库 的 所 有 UDT 值 都 
作为 完整 的 行 出 现在 对 象 表 中 ， 并 且 指 向 它们 的 REF 可 能 出 现在 列 中 。Create Type 语句 的 语 
法 与 SQL-99 一 样 ， 只 是 它 不 允许 定 艾 方法 。 


C.13 Create View 语句 


Create View 语 句 完整 的 基本 语法 如 图 7-13 所 示 。 
[EXEC SOL] CREATE VIEW [schema.Jyiewname [fcolumrname {,. columnname,..,};] 
AS subquery [WITH CHECK OPTION}; 


这 里 的 子 查询 可 以 包括 一 个 可 选 的 UNION 子 句 。 在 程序 中 Create View 语 名 作为 骨 入 式 
SQL 语句 是 合法 的 ,但 视图 的 子 查询 中 不 能 有 宿主 变量 上 或 任何 动态 参数 。WITH CHECK 
OPTION 可 选项 的 具体 省 尽 参 见 图 7-13。 

ORACLE、DB2 UDB 、INFORMIJIX 、Entry SQL-92、Core SQL-99 和 X/Open 都 支持 基本 
的 Create View 语 法 。 此 外 ORACLE 还 提供 额外 的 WITH READ ONLY 用 来 防止 对 视图 的 更 新 。 

对 象 一 关系 考虑 

ORACLE、PB2 UDB 和 INFORMIX 才 允许 视图 表 与 对 象 表 一 样 操作 ， 即 使 子 查 询 是 建立 
在 关系 数据 之 上 的 。 在 这 种 情况 下 ， 在 Create Viewi 语 句 中 可 用 对 象 类 型 或 行 类 型 取 赫 列 列表 。 


eer 
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在 ORACLE 中 ， 最 简单 语法 如 下 : 


CREATE YIEW [schema, Jyiewname 
{f[tcolumnname L, columnname...}]i] 
| OF [Lschema.Jobjtypename WITH OBJECT QID DEFAULT} -- simpiest object view form 
A5 subguery [WITH {READ ONLY | CHECK OPTION}]; -- where the data comes from 


- relational syritax 


INFORMIX 用 更 简单 的 语法 OF [schema.] hypename 来 指明 对 象形 不 { 上古 需 和 要 
DQBJECT OID DEFAULT 子 可 )， 而 DB2 UDB 的 语法 则 由 复 灯 一些，。Full SQL-99 中 在 列 列表 之 
后 有 可 选项 OF [schema.] typename， 这 样 可 方便 地 使 用 用 户 自 定 闵 的 类 型 定义 更 有 效 的 
列 别名 。 子 查询 需要 为 与 类 型 匹配 的 每 个 顶层 的 ORACLE 、DB2 UDB 的 属性 或 INFORMIX 的 
字段 提供 一 列 。 同 样 使 用 列 列 表 和 对 象 表 的 子 查询 来 把 对 象 表 转 化 为 关系 表 。 


C.14 Declare Cursor 语 铝 


X/Open {Entry SQL-92 ) 的 Declare Cursor 语 何 的 语法 如 图 C-23 所 二， 与 5.3 节 网 5-5 基 本 
一 样 。 在 图 C-23 中 定义 的 子 查询 语法 就 是 如 图 3-11 所 示 的 一 般 Select 语 句 语 法 并 旦 在 图 C-27 中 
重复 。 


EXEC SQL DECLARE cursor_name CURSOR FOR 
Subquery 


LORDER BY restult_eolumn [ASC | DESCY {, result_column [ASC | DESCI...} 
[CFOR {READ ONLY | UPBATE [OF columnname {, columnname...}]}]: 





图 C-23 Open 柜 和信 式 5QL 持 Declare Cursor 语 尘 


注意 Fetch 语 句 用 于 从 游标 中 提取 所 先行 但 是 游标 在 行 集合 中 只 能 向 前 移动 。 这 个 限制 
在 SQL-99 的 可 滚动 游标 扩展 功能 中 得 以 克服 。 
SQL-99 的 Declare Cursor 语 向 
Full SQL-99 提 供 Peclare Cursor 和 和 Fetch 语句 的 一 些 重 要 特征 。 首 先 ，Declare Cursor 语 法 
如 图 C-24 所 示 。 
EXEC SQL DECLARE cursor name LINSENSITIVE] CSCROLL] CURSOR [NITH HOLD] FOR 
Subquery 


{UNION Subqueryt 
[ORDER BY resu1t_ column [AS | DESCY f, result colummn [ASC | DESC].,.,.} 
{FOR READ ONLY | FOR UPDATE OF columrname {, OF colummnname}]; 





图 C-24 SQL-99 红 人 人 式 SQL 的 Declare Curseri 开 法 


三 个 新 的 语法 元 素 是 关键 字 INTENSIVE、SCROLL 和 WITH HOLD:; 其 中 只 有 WITH 
HOLD 在 Coere 3QL-99 中 出 更。 如 在 游标 定义 时 梗 用 SCROLL 选 项 ， 则 游标 就 可 前 后 滚动 ， 并 
且 Fetch 语 名 的 相应 的 功能 也 可 实现 。 详 细 信 息 参 见 5.7 节 。 


C.15 Delete 语句 


目前 有 两 种 删 辽 语 名 形式 一 种 是 定位 删除 ， 即 只 删除 游标 中 当前 行 ， 另 一 种 是 查找 删 
除 ， 与 3.10 节 介绍 的 交互 式 SQL Delete-- 样 。 下 而 是 这 黄种 形式 的 语法 ， 
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[EXER SOQLT DELETE FROM fschema. Ttablename 


[WHERE search_conditioen]: -- searched delete 
ExwEC SQL DELETE FROM [schema.}Jtablename 
[WHERE CURRENT QF cursor. name]; -- positioned delete 


定位 删除 使 用 了 一 种 特殊 语法 : CURRENT OF cursor_name。 在 这 两 种 形式 中 ， 如 不 
使 用 WHERE 子 句 ， 则 会 把 整个 表 都 删除 掉 。 详 细 信 息 参 见 图 5-6-。 

X/Open ，SQL-92、Entry SQL-99 和 Eull SQL-99 都 对 以 上 形式 做 出 了 规定 。 只 是 Full SQL- 
99 在 对 象 -关系 上 做 了 一 些 扩展 。 所 有 的 主要 数据 库 产品 都 支持 以 上 形式 。 此 外 ，ODRACLE 和 
DB2 UDB 还 可 以 在 表 名 后 面 指定 相关 名 ， 用 在 WHERE 子 句 中 ， 

对 象 - 关 系 考 虑 

在 有 对 每 层次 类 型 的 表 中 做 册 除 操作 时 ， 为 限制 只 删除 -个 表 中 行 ， 可 用 ONLY 
[schema.] tablename 来 替代 [schema.] tablename。 在 Full SQL-99 中 有 它 的 标准 并 
得 到 INFORMIX 和 DB2 UDB 的 支持 。 


C.16 Describe 语 铝 


当 为 准备 sqltext[] 中 的 动 仿 选择 语句 而 调用 Prepare 诸 句 时 ， 编 译 进 得 就 会 计算 时 归 同 
的 列 值 个 数 和 类 型 。 为 了 使 程序 可 以 得 到 这 些 信 息 ， 必 须 调用 动态 SQL Describe 语 句 ， 用 来 
将 检索 到 行 的 信息 放 到 SQLDA 变 量 结 构 中 。Describe 语 旬 的 语法 如 下 所 示 : 

EXEC SOL DESCRIBE statement. identifier INTO sqldavar pointer: 

动态 Select 语 句 的 例子 在 $5.6 节 中 。 注 意 INFORMIX 与 ORACLE 的 SQLDA 结果 相 差 很 大 ， 
但 INFORMIX 的 与 DB2 UDB 的 很 接近 。XiOpen 与 5QL-99 不 使 用 SQLDA 结 构 而 是 使 用 更 多 的 
SQL 语法 ， 但 是 DB2 UDB 和 ORACLE 都 没有 实现 这 种 方法 。 而 INFORMIX 则 对 SQLDA 和 
X/Openl 辣 法 都 支持 。 


C.17 Disconnecti 语 各 


用 在 族人 式 SQL 程 序 中 的 Diseconneect 语 名 用 于 断 开 与 数据 库 的 连接 。 与 Connect 诸 名 一 样 ， 
它 不 是 Entry SQL-92 或 Core SQL-99 标 准 的 一 部 分 ， 而 且 各 生产 厂 座 之 间 语 法 相差 很 大。Full 
SQL-99 的 Disconnect 襄 句 如 下 贞 水 : 

EXEC SQL DISCONNECT fconnectname | CURRENT}: 

在 X/Open 中 的 Disconnect 语 名 是 : 

EXEC SOL DISCONNECT fconnectname |ALL|CURRENT| DEFAULT]: 

从 ORACLE 7 开始 ，ORACELE 用 不 同 的 语句 断 开 连接 : 

EXEC SQL COMMIT RELEASE; 

DB2 UDB 则 遵循 991L-99 标 准 ， 在 Disconnect 语 句 之 前 必须 有 Commit 或 Rollback 语 名 。 可 
在 一 条 语句 中 执行 提 灾 各 断 升 与 数据 库 的 连接 : 

EXEC SOL COMMIT RESET: 


详细 信息 套 见 5.1 节 。 
C.18 Drop Funetion 语 名 
只 有 SQL.99 定 六 了 用 户 自 定 习 国 数 。Drop Function 语 法 如 下 : 


548 载 据 肆 碌 理 、 编 程 与 性 训 


DROP {FUNCTION fschema, Jfunctionname Liparamtype 1, paramtype ,..,}}] 
|SPECIFIC FUNCTION Lschema. Jfunctionname} 
CASCADE | RESTRICT; 


在 Core SQL-99 中 没有 CASCADE 选 项 ， 而 且 必 须 显示 地 指定 RESTRICT 选 项 。 有 参数 类 
型 列表 的 形式 可 以 删除 多 个 过 载 函 数 中 相应 的 一 个 ， 这 些 晒 数 有 相同 的 名 字 但 它们 的 参数 齐 
表 不 同 。 

INFORMIX 和 DB2 UDB 痢 遵守 SQL-99 标 准 ， 而 ORACLE 则 有 更 简单 的 形式 : 

DROP FUNCTION [schema. jrunctionname: 

因为 ORACLE 不 支持 “独立 ” 靖 数 (用 Create Funetion 创 建 ， 用 Drop Function 删 除 ， 并 只 
在 模式 中 不 出 现在 任何 包 中 的 旺 数 ) 过 载 ， 所 以 在 DRACLE 中 不 需要 带 有 和 参数 列表 的 形式 。 
成 员 蚁 数 和 包 内 函数 可 以 过 载 。 成 员 砚 数 随 它 的 对 象 类 型 一 起 删除 。 包 中 是 ORACLE 专 有 的 
关系 数据 库 对 象 的 封装 集合 . 这 已 超出 本 韦 范 围 。 


C.19 Drop Index 语 全 
只 有 XIAOpen 对 Drop Index 语 句 制 订 了 标准 ， 如 下 所 示 : 


[EXEC SQL DROP INDEX Fschema.]indexname: 


所 有 主要 数据 库 产品 都 支持 这 种 形式 。 更 多 信息 参见 8.1 节 。 
C.20 Drop Trigger 语 名 
具有 SQL-99 标 准 提 到 了 和 触发 花 ， 它 提供 的 语法 如 下 : 


[EXEC SOL] BROP TRIGGER [schema. Jtriggername: 
几乎 在 所 有 提供 触发 器 的 产品 中 都 支持 这 种 语法 ， 包 括 OQRACLE、DB2 UDB 和 
INFORMIX。 详 细 信 息 参 见 7.1 节 。 


C.21 Drop(Row) Type 语句 
只 有 SQL-99 标 准 涉 及 到 用 户 自 定义 类 型 ， 它 提供 的 语法 如 下 : 


DROP TYPE [schema,]typename CASCADE |RESTRICT: 

在 Core SQL-99 中 没有 CASCADE 选 项 ， 而 且 必 须 显 式 地 指明 RESTRICT 选 项 。 因 为 用 户 
自 定义 结构 类 型 出 现在 SQL-99 扩 展 功能 中 ， 所 以 在 Core SQL-99 中 它 只 删除 特殊 类 型 。 关 于 
特 妹 类 型 与 用 户 白 定义 结构 类 型 的 信息 可 参考 本 附录 的 Create Type 部 分 。 

在 ORACLE 中 ， 用 户 自 定义 结构 类 型 又 称 为 对 象 类 型 ， 它 的 删除 方 法 如 下 : 

DROP TYPE [schema. Jtypename [FORCE]; 

这 里 的 FORCE 选 项 用 于 删除 有 REF 依 赖 的 类 型 。 关 于 REF 依 赖 的 信息 博 见 4.2.1 节 的 末 
尾部 分 。 

在 INFEORMIX 中 ， 用 户 自 定义 结构 类 型 又 称 为 行业 型， 它 的 删 陈 方法 如 下 : 

DROF ROW TYPE fschema.Jtypename RESTRICT: 

关于 行 类 型 的 更 多 信息 参见 4.2.2 第。INFORMIX 也 支持 特殊 类 型 ， 并 可 用 Core SQL-99 的 
语法 删除 它们 。 

在 DB2 UDB 中 ， 用 户 自 定义 结构 类 型 和 特殊 类 型 的 删除 可 用 同 -~ 种 方法 ， 如 下 : 


DROP TOISTINCTY TYPE Lschema.} 
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C.22 Drop {Schema | Table | View} 语 名 


Drop 语 句 用 于 从 系统 日 录 中 删除 模式 、 表 上 或 视图 定义 。 如 是 表 《〈 或 模式 )， 则 释放 所 有 分 
配给 它 的 空间 。XiOpen 中 Drop 语 句 的 标准 的 完整 描述 如 下 : 
[LEXEC SQL] DROP LSCHEMA Schemaname | TABLE tablename| ViEWw viewnane} 
{CASCADE | RESTRICT}; 


其 中 ， 表 名 ‘(tablename) 或 视图 名 {viewname1 可 用 模式 各 {schemaname}) 作 前 级 。 
类 于 CASCADE 和 RESTRICT 的 讨论 参见 图 7-14。 奇 怪 的 是 ， 在 Entry SQL-92 中 没有 提 到 Drop 
Taple 语 句 。Full SQL-92 与 X/Open 和 Full SQL-99 的 一 样 。Core SQL-99 中 不 需要 CASCADE 选 
项 但 仍 需 RESTRICT 选 项 。 各 产品 都 与 标准 略 有 差别 ， 如 图 C-25 所 示 。 









X/Qpen, Full 
ORACLE DB2Z UDE INFORMIX SQL-32, -99 


DROP TABLE [万 B5CADE [CASCADE [CASCADE 
tablename, .. CONSTRAINTS] [RESTRICTI IRESTRICT]} 
DROP YIEW [CASCADE [CASCADE 
Yiewname. .. IRESTRICT] IRESTRICT) 
DROP SCHENMA - J | CCADE 


图 C-25 Drop Table 和 Drop View 诸 名 在 各 产品 和 标准 中 的 不 同 选 项 
当 带 有 RESTRICT 选 项 删除 模式 时 ， 除 非 模式 是 空 ， 也 就 是 它 不 含有 表 或 其 他 数据 ， 碍 则 
不 能 成 功 。 当 使 用 CASCADBHE 选 项 删除 模式 时 ， 则 模式 中 所 有 相关 的 数据 都 将 被 删除 .正如 
Entry SQL-92 和 Core SQL-99 所 东 ， 用 户 可 以 使 用 与 用 户 名 相同 的 名字 作为 模式 各， 这 样 当 他 
们 账户 创建 时 ， 就 不 能 创建 其 他 模式 。 在 这 种 情况 下 ，ORACLE 和 INFORMIX 的 Drop Schema 
不 是 很 有 有 用。 但 在 DB2 UDB 中 ， 用 户 可 将 与 账 族 名 相同 的 名 字 给 原始 模式 ,而 可 用 Create 
Schema 创建 任何 其 他 名 字 的 模式 ， 并 且 这 些 模 式 也 可 用 Drop Schema 来 删除 。 


C.23 Execute 语 铝 


当 调 用 Prepare 语 名 来 准备 来 自 sqltext[ ] 字 符 串 的 动态 SQL 之 后 ，Execute 语 名 用 来 把 字符 
串 中 的 动态 参数 与 所 需 参 数值 关联 起 来 ， 并 执行 准备 好 的 语句 。 下 面 就 是 我 们 介绍 过 的 所 有 
标准 及 产品 的 Execute 语 句 的 语法 : 


EXEC SOL EXECUTE statement identifier 
USING :host variable f. :host variable,..}: 


Execute 博 人 句 的 例子 参见 5.6 节 。 
C.24 Execute Immediate 语 名 


因为 Execute Immediate 语 句 可 执行 舍 有 箱 二 变量 字符 串 的 动态 SQL 语句 ， 所 以 不 需要 前 
面 的 Prepare 语 句 。 我 们 介绍 过 的 所 有 标准 及 产品 的 Execute Imnmediate 语 刨 一般 模式 如 下 : 
EXEC SQL EXECUTE JMMEDIATE :host string; 


注意 ， 因 为 Execute Immediate 语 名 是 同一 类 的 ， 所 以 不 需要 任何 如 Prepare 和 Execute 语 句 
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处 理 的 动态 参数 。host_string 所 包含 的 字符 串 内 容 必 须 是 合法 的 SQL 语 名 ， 可 包括 如 下 类 型 ， 
Alter Table, Create Table, Delete, Drop (Table, View 或 Index), Grant, Insert, Revoke 和 Update。 
在 特定 产品 中 其 他 语句 也 可 能 允许。 详细 信息 参见 5.6 节 。 


C.25 Fetch 语 句 
这 语句 可 从 当前 打开 的 游标 中 提取 一 行 ， 在 我 们 介绍 过 的 产品 中 该 语句 者 有 如 下 形式 : 


EXEC SOL FETCH CFROMY cursor_name 
INTO :host variable {f, :host_variable ...} 
| USING DESCRIPTOR :sqldavar pointer; 


SQLDA 变 量 指针 (sqlaavar_pointezr) 由 动态 游标 使 用 ， 而 衔 主 变量 
(host_variable} 则 用 于 接收 由 Fetch 检 索 到 的 值 。 静 态 的 情形 参见 5.3 节 ， 而 动态 的 情形 
参见 5.6 节 。 在 标准 中 使 用 描述 名 而 不 是 指针 。 

Fetch 语 句 在 SQL-99 中 可 滚动 游标 的 应 用 

SOL-99 中 非 动 态 游 标的 Fetch 语 句 语 法 如 图 C-26 所 示 。 详 细 信 息 参 见 5,7 节 。 目 前 我 们 上 所 
介绍 的 产品 中 只 有 INEFORMIX 产 品 支持 这 种 秀 人 式 SQL 特 征 。 


FEXEL SQL FETEH 
[LINHEXT | PRIOR | FIRST | LAST 


| {ABSOLUTE | RELATIYEY} value_ spec) FROM ] 
cursor_name TINTO Post-variable 1{, host-variable}: 





图 C-26 SOL-o99 中 Fetch 语 名 语法 


C.26 Grant 语句 


表 (基本 表 或 视图 表 ) 的 所 有 者 通过 Grant 语 可 把 各 种 对 表 的 访问 权限 【选择 、 更 新 、 删 
除 或 插 人 ) 赋 给 其 他 用 户 。 它 是 一 种 表 访 问安 全 性 的 形式 ， 但 通过 视图 也 可 以 实现 列 的 访问 。 
其 他 用 户 必 须 先 旨 有 数据 库 管理 者 授权 可 以 进入 含有 表 的 数据 库 。 

XIOpen 和 Entry SQL-92 标 准 的 Grant 命 令 如 下 : 

[EXEC SOL] GRANT TALL PRIVILEGES | privilege {., privitege ...}) 

DN tablename | viewname 
TO 《PUBLIC | user-name {fe user-rname 0.5} } [WITH GRANT OPTION] 

ORACLE、DB2 UDB 和 INFORMIX 都 支持 这 种 语法 。X/Open 和 Full SQL-92 也 定义 在 整 
理 、 字 符 集 和 转 措 上 的 Grant 命 令 ， 但 本 附录 中 并 未 对 此 进行 介绍 。Full SQL-99 支 持 所 有 
X/Open 和 SQL-92 所 定义 的 语法 ， 并 增加 了 在 用 户 自 定义 类 型 和 函数 设计 器 上 的 Grant 命 令 。 
Core SQL-99 支 持 上 面 的 表 / 视 图 和 在 非 结构 化 的 用 户 目 定义 类 型 及 SQL 调用 的 畏 数 设计 船上 的 

在 XiOpen 和 Entry SQL-92 中 ，Grant 可 以 授予 所 有 类 型 的 访问 特权 (ALL PRIVILEGES) 或 
一 些 下 面 列 出 来 的 特权 : 

SELECT 

DELETE 


TNSERT 
HPDATE [feolumnname {, columnname . . . })1}i 
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REFERENEES [ {columnname {f, columnname . . . 11)] 


而 在 Core SQL-99 则 增加 了 在 用 户 自 定义 函数 和 过 程 上 的 EXECUTE 授 权 。ORACLE、 
DB2 UDB 利 INFORMIX 都 广 持 所 有 这 些 特权 ， 并 如 上 表 的 ALTER 特 权 及 一 些 与 相关 产品 的 附 
如 特权 。 许 细作 息 和 参见 7.3 节 。 

在 贱 子 用 户 PBA 特 权 或 其 他 类 似 的 特权 时 ， 不同 的 产品 有 不 同 的 Grant 语法 。 如 
INFORMIX 使 用 下 面 语法 : 


[EXEC SOL] GRANT LOEONNECT |RESOURCE| DBA 


TO user-name 1. user-name ...}; 


ORACLE 使 用 相同 的 语法 ， 并 增加 50 多 个 不 同 的 系统 特权 ， 包 括 DBA 的 SYSDBA 特 权 。 
DB2 UDB 的 Grant 有 好 几 种 形式 ， 其 d' 授 子 DBA 特 权 的 是 Grant Database Authoritics 语 句 。 


C.27 Jnsert 诸 句 


正如 3.10 利 5.3 节 所 述 ，Insert 语 名 在 髓 人 入 式 和 交互 式 SQL 中 都 是 一 样 的 。Insert 语 名 有 两 种 
形式 ,一 种 是 搬入 具体 值 的 一 行 记 隶 ， 男 一 种 是 使 用 前 面 提 到 的 子 查询 形式 插入 包 行 记录 。 
X/Open 和 Entry SQL-92 标 准 关 寺 Insert 语 名 的 语法 如 下 : 

[EXEE SOL] INSERT INTO [schema.]tabtlename [tcolummname {, columnname ...}}] 

{VALUES texpr | NULL {f. expr | NULL...1) 1 subquery} 


新 插入 的 行 的 位 置 不 能 预先 设 定 ， 它 的 位 置 是 由 表 的 磁盘 结构 所 决定 的 -。 

X/Open 与 Entry SQL-92 的 区 别 主 要 在 于 如 和 何 明确 定义 列 缺 省 值 的 使 用 。Coere SQL-99 与 
X/Open 和 Full SQL-92 - 样 ， 人 允许 使 用 DEFAULT 来 代 普 VALUES 子 句 中 任何 列 慎 的 expr | 
NULL 值 。 但 是 ,在 没有 指明 具体 值 时 也 使 用 了 缺 省 值 ， 所 以 对 Insert 来 说 DEFAULT 关 键 宇 对 
于 安装 缺 省 值 并 不 是 很 重要 的 。 

所 有 主要 的 数据 库 产品 都 支持 上 面 的 Insert 茜 本 SQL 语 法 。 在 ORACLE 中 有 捅 人 到 骨 套 表 
的 附加 形式 ， 和 参见 4.3.1 节 。 类 亿 地 ，INEFORMIX 也 有 插 人 到 汇集 表 的 特殊 形式 。 另 一 个 产品 
与 标准 之 间 的 差别 是 所 允许 的 查询 的 形式 不 同 。Full SQL-92 和 DB2 UDB 都 支持 子 查询 如 图 3- 
10 所 示 的 高 级 形式 ， 包 括 INTERSECT 和 EXCEPT 操 作 符 。DRACLE 与 这 很 接近 ， 只 是 用 
MINUS 蔡 代 EXCEPT。XrDpen 和 INEORMIX 都 不 允许 在 了 查询 中 使 用 INTERSECT 和 EXCEPT， 
X/Open 甚至 不 允许 使 用 UNION,，, 但 INFORMIX 人 允许 。 

对 癌 一 关系 语法 

ORACLE 中 人 允许 用 TABLE {subquery ) 来 取 替 tablename， 这 样 允 许 将 行 插入 髓 套 
表 中 。 

C.28 Open Cursor 语 向 


这 语句 主 票 用 于 打开 先前 声明 的 非 动态 游标 ， 我 们 所 介绍 的 所 有 标准 各 产品 的 形式 
如 下 : 
EXEC SOL OPEN cursor_Nname: 


评 细 信息 参见 5.1 节 。 
如 用 它 打开 动态 游标 使 用 SQLDA 结 构 )， 则 在 我 们 介绍 的 所 有 产品 中 使 用 如 下 语法 ， 
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EXEC SOL DOPEN cursor_name 
BSITHG :host, variable Ef, :host variable...l} 
| USING DESCRIPTOR :sqldavar_pointer: 


可 用 宿主 变量 或 描述 符 值 替代 与 游标 相关 的 准备 好 的 SQL Select 傅 句 的 WHERE 子 名 中 的 
动态 参数 。 详 细 信息 参见 5.6 节 。 在 标准 中 使 用 描述 符 名 而 不 是 指针 。 


C.29 Prepare 语 各 


在 般 入 式 SQL 中 Prepare 语 句 用 于 惟 备 含有 宿主 变量 字符 捉 动 态 SQL 语 名 (参见 Execute 语 
石和 Execute Immediate 语 句 ， 后 者 结合 了 Prepare 语 名 和 Execute 庄 句 的 作用 )。 在 所 介绍 过 的 
所 有 标准 和 产品 中 Prepare 语 句 有 如 下 语法 : 

EXEC SOL PREPARE statement identifier FROM :host string; 

host_string 的 字符 串 内 容 必 须 是 合法 的 SQL 人 语句 ， 可 包括 如 下 类 型 : Alter Table, Create 
Table, Delete, Drop (Table，View 或 Index)，Grant, Insert, Revoke 和 Update。 在 特定 产品 中 其 他 
语句 也 可 能 允许 。 详 细 依 息 参见 $.6 节 。 


C.30 Revoke 语 名 
在 X/Open 和 Core SQL-99 中 Revoke 语 名 用 于 取消 表 的 特权 : 


[EXEC SQLY REYOKE {ALL PRIYVILEGSES | privilege 1, privilege ...} } 
ON tablename | viewname 
FROM {PUBLIC [| user-name {, User-name ...} 1 
CASCADE | RESTRICT: 
Revoke 语 名 可 以 取消 当前 用 户 先前 赋予 一 特定 用 户 的 一 组 特权 。 与 Grant 语 名 不 同 ， 
Revoke 语 句 在 取消 更 新 特权 时 ， 不 能 指定 询 名 。 表 的 拥有 者 自动 拥有 所 有 特权 ， 并且 它 们 是 不 


能 取消 的 。 
ORACLE 和 DB2 UDB 都 没有 实现 CASCADE | RESTRICT 子 名 ,但 INFORMIX 实 现 了 ， 


并 且 它 们 是 可 选 的 。 详 细 信 息 参 见 7.3 节 ， 
C.31 Rollback 谐 名 

在 时 人 式 SQL 程 序 中 Rollhack 语 句 用 于 必须 中 止 活动 事务 的 时 候 ， 也 就 是 异常 中 止 。 在 我 
们 所 介绍 的 所 有 标准 和 产品 中 都 有 以 下 语法 : 

LEXEC SOLT ROLLEBACKE [CHORKY: 

当 执 行 Rollback 语 名 时 ， 所 有 事务 中 所 做 的 更 新 将 被 撤销 ， 把 先前 的 值 放 回 原 来 位 置 ， 并 
让 其 他 用 户 也 可 见 。 如 果 一 个 程序 中 正 前 没有 执行 Commit 或 Rellhack 语 句 ， 副 不 同 的 产品 会 
采取 不 同 的 缺 省 操作 。 详 细 信 息 参 见 5.4。 


C.32 Seject 语 各 


交互 式 Select 语 名 的 所 有 语法 如 图 C-27 所 示 。 语 法 中 提 到 的 子 查 询 就 是 SQL-92 和 和 X/Open 
中 的 查询 表达 式 。ORACLE 也 称 其 为 子 查询 。 交 互 式 Select 语 法 的 不 同 子 句 和 语法 元 率 在 第 3 
音 进 行 了 详细 的 介绍 。Full SQL-92 和 Core SQL-99 都 介 许 用 EXCEPT 和 UNION[ALLI 来 连接 子 


附录 CC SQL 语 法 553 


查询 。Full SQL-92 和 SQL-99 的 一 个 扩展 特征 则 允许 INTERSECT[ALL]. 所 有 这 些 信 息 参 见 
3.6 节 。 
1. 通用 语法 元 素 
图 C-27 中 子 查 询 的 表 引 用 形式 在 不 同 的 标 淮 中 是 不 一 样 的 。 参 见 图 C-28。 在 Core SQL-99 
或 XAOpen 中 连接 表 的 形式 是 可 选 的 并 被 放 在 圆 括号 中 。 
SUbqUerY 3: ;一 


SELECT [ALL | DISTINCT] { * | expr [CTAS] ¢_alias] {. expr [[AS] C_alias], .jh 
FROM tableref {, tableref...] 


[WHERE séarch_ condition] 
[BROUP BY colname {, tolname...}] 


[HAYING search condition] 
| subquery UNIOMN [ALL] subquery 


Select statetent +:;= 
Subquery [ORDER BY resu1t_columr [ASC | DESCY [, result_column EASC | DESC1...}] 





图 C-27 基本 子 查询 和 基本 Sejlect 语 名 一 般 形 式 


Fntry SOL -Se 
tableref::= tablename [corr_name] 
Basic SOL: 
tableref::= tablename [{[AS] corr_name] 
XOPFEN: 如 果 司 用 IOIN ， 则 NATURAL，ON 和 USINSG 中 的 一 个 必须 梧 用 
tableref;::= [stchema, ltablename [[AS} corr_name] -. simple form 
ttablerefl [NATURAL] CINNER | {LEFT|IRIGHT} [OUTER]] 3OIN tablerefe2 -- join form 
{ON search_ condition | USING tcolname {, colname ...}}} 
SOL -99 8 Advanced SOL: 
tableref::= [schema. tablename [EAS] corr_namej[teclname {,. colname ,..1)] -- simplée Form 


| tsubqueryy CAS] corr_name [tcolname {. colname...}}] -- non-Core subgquery form 
{tablerefl [INNER | {LEFT|RIGHT} [OUTERJ] JUOTN tableref? -- join form 
{ON Search condition | USING coiname {, colname ...}}} 





图 C_-28 上 表 引 用 {tableref) 的 不 同形 式 


X/Open 标准 中 有 与 基本 SQL 和 Entry SQL-92 相 同 的 谓词 ， 如 图 C-29 所 示 。 在 Full SQL-92 
中 增加 了 OQVYERLAPS 谓 词 ， 用 于 两 个 时 间 上 段 之 间 是 否 有 重合 。 其 取 值 可 以 是 
CURRENT DATE、CURRENT_TIME 或 CURRENT_TIMESTAMP， 这 些 有 用 的 攀 造 在 x/OQpen 
中 被 认为 是 伪 代 码 (pseudo_lierals)， 但 在 SQL 92 标 准 中 是 更 为 严格 一 些 的 非 Entry 的 日 期 时 间 
值 函 数 ， 在 SQL-92 中 ， 图 C-29 中 的 子 查询 是 不 允许 有 UNION 的 。 在 Core SQL-99 中 ， 比 较 谓 
词 一 般 形 式 是 : expr19 expr2， 其 中 表达 式 expr 中 可 有 (subquery) 形 式 。 其 他 使 用 
(subauery) 的 形式 与 Core SQL-99 一 样 ， 只 是 允许 在 子 查 询 中 使 用 UNION、RXCEPT 和 JOIN。 
Core SQL-99 没 有 额外 的 谓词 。 谓 词 可 以 组 合成 如 图 C-30 所 示 的 搜索 条 件 。 表 达 式 的 语法 和 其 
他 相关 信息 参见 3.9 节 。 

2. 晓 六 过 SODL 的 Select 语 可 

只 有 在 检索 结果 不 多 隆 一 行 (0 或 1 行 都 允许 ) 时 才 可 以 在 嵌 人 式 SQL 程 序 中 执行 Select 语 铝 ， 
否则 使 用 游标 。 如 果 Select 语 名 在 嵌入 式 SQL 中 返回 多 于 1 行 ， 则 会 返回 运行 期 错误 。 该 语句 


554 发 据 奋 原理 、 疙 得 与 性 能 


在 嵌 人 式 SQL 中 语法 如 图 C-31 所 示 。 

产品 间 差 别 

这 里 涉及 到 的 三 种 产品 上 部 支持 如 图 C-27、C-29 和 C-31 所 示 的 语法 ， 它 们 都 使 用 如 图 C-238 
所 示 的 Entry SQL-92 中 的 表 引 用 形式 。 如 基本 SQL 中 表 引 用 形式 所 示 ，INFORMIX 和 DHB2 
UDB( 但 ORACLE 不 ) 都 允许 使 用 可 选 关键 字 AS， 它们 还 支持 在 图 C-28 的 SQL-99 表 3 引用 形式 中 
标记 为 Simple form 的 语法 ,也 就 是 说 ， 支 持 为 溃 询 中 的 FROM 表 中 的 州 分 配 新 名 的 功能 。 
DB2 UDBH 和 ORACLE 都 支持 非 Core SQL 子 查询 形式 ， 但 是 ORACLE 不 允 评 在 加 插 导 的 子 查询 
后 加 列 列表 ， 也 不 支持 AS 关 键 词 ， 因 此 它 的 子 查 询 形 式 非 常 简单 为 (subquery) 
corr_name。 在 这 三 个 产品 中 只 有 DB2 UDB 支 持 如 图 C-28 所 示 的 SQL-99 连 接 形式 ， 但 它 也 
不 支持 其 中 的 USING 子 句 。ORACLE 和 INEORMIX 对 左右 内 连接 都 有 特殊 堪 式 。 


比较 请 词 exprl B texpr2 | (Dabduery 有 
BETWEEN 谓 词 exprl [NOT] BETWEEN expr2 and expr3 


量化 谓词 expr 9 [ALL | SOME | ANY] iSubquery) 


TN 语 问 expr [NOTI IN (subquery] 
expr [NOTL IN fvaluc {, valueli 
EXISTS 襄 词 [NOTI EXISTS 1Subquery) 
IS NULEL 抽 疗 cojname 193 [NGOT] NULL. 
LIKE 请 训 colname {NOT] LIKE pattern-vatlue [ESCAPE escape-char-valuc] 





图 C-29 基本 SQL 谓 词 


谓词 
[Seatch_congqition) 
NOT search_conditinn 
search_condition ND search condition 


search_condition OR search_condition 





图 心 -30 Entry SQL-92,XiOpen 和 Core SQL-99 中 搜索 条 件 (search_condition) 的 递归 定义 


EXEC SAL SELECT EALL | DISTINCT] expression {, expressionl 
INTO host-variable [, host-variable} 


FROM tableref [. tableref ...) 
[WHERE search condition]: 





图 C-31 Select 语 句 基 本 髓 人 蕊 SQL 语 法 


3, 对 象 -关系 语法 
对 象 - 美 系 扩展 使 用 一 种 新 的 表达 式 语法 一 一 带 点 标识 方法 来 访问 结构 类 型 的 部 分 ,创建 
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这 些 类 型 新 的 实例 及 引用 整个 行 对 象 (在 ORACLE 中 居 VALUE(t_alias) ) 在 DRACLE 中 对 象 
的 引用 使 用 REF ( ) 和 DEREF ( )。 关 于 ORACLE 使 用 IS DANGLING 米 检测 甚 挂 对 象 REF 的 
信息 参见 4.2.1 节 。 因 为 简单 对 象 态 引 册 主要 对 列 所 允许 的 类 者 进 行 了 扩展 ， 而 它们 一 般 不 能 
直接 出 现在 Select 语 句 中 《除非 在 CAST 表 达 式 中 )， 所 以 Select 语 名 所 受 影 响 较 小 ， 较 大 的 影 
响 来 源 于 汇集 ， 因 为 汇集 提供 了 新 的 表 源 ， 即 查询 的 主要 材料 。 

如 图 C-32 所 示 ， 表 引用 形式 增 有 了 可 以 从 沪 集 中 选择 的 功能 。 这 里 ， 把 4.3.1 节 和 4.3.2 节 
的 图 4-22 和 图 4-28 结 合 在 一 起 ， 此 外 增加 了 4.2.2 节 的 ONLY 关键 字 。ONLY 关 键 字 可 以 限制 只 
从 所 指定 的 表 中 检索 行 ， 市 涉 包 括 其 继 打 层次 上 子 表 的 行 ( 这 方向 信息 ， 戎 见 4.2.2 节 的 Select 
语句 )。 与 INFORMIX 一 样 ，Full SQL-99 有 对 象 - 关 系 表 引用 语 靶 ， 它 们 的 区 别 只 是 在 
INFORMIX 用 UNNEST 蔡 代 TABLE 以 及 一 个 附加 的 可 选 子 柯 。 


ORACLE object -relationa?l tablierer 
tableref::= {{schema,Jtablename | (rowset_ valued subduery) 


| TABLE{ collection expressiony} 
[corr_namel 2 BS eyNOrd not a1lowed 


THFORMIN opject-reTationa? tablerer 


tableref::= [sthema. Jtablename -- no relattonal subgquery) form 
| TABLECcoOllection_expression) 


| ONLY Lschema. Jtablenamet -- restriction in table hierarchy 


[[AS] corr_name Cicolumnname, [columnname...})]] 





图 C-32 和 包括 对 象 -关系 扩展 的 ORACLE 和 INFORMIX 表 引用 语法 

INFORMIX 扩 展 IN 谓 词 为 INW collection_expresgsion 的 形式 并 提供 了 
CARDINALITY (collection_columnnamejr 用 于 计算 汇集 列 值 中 元 素 的 个 数 ) ORACLE 则 提 
供用 于 交互 选择 的 CURSORO 表 达 式 ， 它 允许 显示 外 表 中 每 一 行 的 艇 套 表 的 行 ， 并 提供 新 的 
CAST 形 式 转化 汇集 类 型 。 
C.33 Update 语 句 

与 Delete 诸 他 一 样 ，Bpdate 诸 名 也 有 两 种 形式 : 一 种 是 查找 更 新 ， 订 在 交互 或 能 人 式 SQL 中 执行 
的 可 一 次 更 新 多 行 记录 的 Update 语 句 ; 另 一 种 是 定 倍 更 新 ， 它 只 能 通过 游标 操作 并 只 在 讶 人 式 SQL 中 
有 效 。 基 本 的 查找 Update 语 法 如 图 C-33 所 示 ， 而 定位 Update 语 法 则 在 图 C-34 中 。 详 细 信 息 参 见 5.3 节 。- 


[EXEC SOL] UPDATE Eschema.Jtabiename 
SET columnname = expr | NuULLT 【subqueryy 


[, columnname = expr | NULL | (subquery)...1 





[WHERE search_condition]:; 


图 C-33 搜索 Update 语 名 基本 语法 


几乎 所 有 主要 的 数据 库 产品 部 支持 Update 语 名 的 基本 语法 ,它们 也 同时 遵守 Full SQL-92 
和 Core SQL-99。 但 是 ,在 X/Open 和 Entry SQL-92 标 准 中 并 没有 新 的 列 值 指定 的 
[subquery) 选项 。 由 于 它们 也 不 允许 {subquery) 量化 为 表达 式 ， 所 以 这 个 选项 是 不 符合 
的 。 而 Full SOL-92 和 Core 8QL-99 则 扩展 了 表达 式 的 含义 使 其 包括 {subauery)。 在 这 些 情 
况 下 ， 可 以 各 除 单独 的 (subauery) 选 项， 或 者 注意 到 它 是 多 余 的 。 


556 并 握 大 上 奈 理 、 织 如 与 糙 能 


EXEC SOL UPDATE [schema, J}tablename 
SET columnname = expr | NULL {subqguery} 


{, columnname = expr | NULL | 《Subqueryy 
WHERE CURRENT OF cursor_names 





图 C-34 艇 入 式 定 仔 Update 语句 基本 语法 
对 象 - 关 系 语 法 
ORACLE 人 允许 用 TABLE(subquery) 来 蔡 代 表 和 名 ， 这 里 子 查 询 返 回 般 套 表 的 值 ， 这 样 允 许 
更 新 最 套 表 的 行 。 在 INFORMIX 中 可 用 ONLY {Ischema.] tablename} 来 百代 表 和 名 ， 用 
来 限制 更 新 只 能 在 指定 的 珍 上 进行 ， 而 不 更 新 表层 次 中 子 表 的 行 。 


附录 D 集合 查询 计数 


下 面 列 出 了 在 集合 查询 基准 程序 中 从 查询 Q1 到 Q6B 的 返回 的 行 数 。 该 列表 对 实践 人 员 会 
有 所 带 助 。 在 任何 平台 上 如 果 正 确 产生 和 加 载 数据 ， 这 些 数据 应 该 都 是 一 样 的 。 





查询 实例 行 数 总 结 
Ol KSEQ 1 
Ql K100K 8 
1 K10K 归 曙 
Ql KI1K 1003 
[| KIO0 10 O91 
Ol E25 39 B45 
Ql K10 99 902 
Ol KS 200 637 
Q1 K4 249 43] 
Ql K2? 499 424 
Q2A KSEQ 1 
O25 K100K 5 
OA K10K 58 
QA KIK 487 
O02A 用 100 5009 
Q2A K?25 19 876 
O2A K10 49 939 
Q2A Ks 100 081 
Q2A Kd 125 262 
Q2B KSEQ 499 423 
2B Kk 1N00RK 总 
Q2B KI0K 499 366 
Q2B KIK 498 937 
Q2B Kl100 494 415 
Q2B K25 479 548 
O28 K1D 449 485 
OQ2B 防 $ 499 343 
O28 K4 374 162 
3 区 100K 1 434 
Q3A KI1OK 9 5513 
D3A K100 991 d96 6%d4 
Q3A K25 3989 1978 118 
Q3A K10 9920 4 950 698 
Q3A Ks 20 116 10 027 345 
Q3A Kd 24 998 12 499 521 
Q3B K100K 1 434 
Q3B K10K 6 3300 
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( 续 ) 
查询 实例 行 数 总 结 
Q3B KiO0 597 299 039 
Qa3B6 K25 2423 i 209 973 
Q3B K10 5y59 2 967 225 
03B Ks 12 000 5 980 617 
Q3B Kd 15031 了 496 733 
Q4A 1-3 10 059 
Od4A 2-4 4027 
Q4A 3-5 1637 
OQ4A 4-6 4021 
Q4A 4-7 7924 
OdA 6-8 10 294 
Q4A 7-9 4006 
QO4A 8-10 785 
OQ4B 1-5 161 
Q46 2-6 36 
Q4B 3-7 142 
0Q4B 4-8 172 
QO4B 5-9 77 
Q4B 6-10 76 
QQ4B 7-1 152 
O05 K2=K100c1 4962 
05 Kd=K25=] 9970 
QQ5 区 10=K25=1 4049 
0Q6A Ki00K 23 
OQ6A KAOK 55 
Q6A KIOK 239 
QQ6A KIK 2014 
Q6A Ki00 19 948 
Q6B K40K 3 
Q6B KIOK 4 
Q6B KIK 81 
Q6B K100 304 


EO 


习题 解答 
第 2 章 习 题解 答 
2.1 (a) A 和 B 都 是 键 , 内 为 作为 单个 属性 它们 在 每 一 行 的 值 都 不 相同 。 设 有 其 他 键 可 以 


包含 A 或 者 B。C 或 者 D 都 不 能 把 所有 行者 区别 开 ,但 是 把 它们 放 在 一 起 可 以 做 到 这 
一 局 。 所 以 ， T1 的 二 个 候选 键 是 A、 Bl 及 CD。 





很 明显 ，D 不 是 任何 键 的 一 部 分 ， 且 ABC 是 一 个 超 键 。 任 何 单 独 的 列 : A、B 或 C 
都 不 是 键 。 这 是 因为 每 一 列 都 有 三 个 相同 的 项 。 列 对 AB、BC 、 或 Ca 也 都 不 是 
键 ， 这 是 因为 它们 都 有 重复 的 项 。 所 以 ，&ABC 是 唯一 的 键 。 

2.2 (a) 三 个 候选 键 是 : ssn, name information-no 和 name address city ztpo 

2.4 {ay 【ORDERS where qty ?=” 1000)[ordno,pid]. 
圆 插 号 是 必须 的 ， 这 是 因为 投影 的 优先 权 较 高 。 

(©) (ORDERS where dottars < 500 JOIN CUSTOMERS) [ordno,cname]. 

在 ORDERS 表 和 CUSTOMERS 表 间 只 有 一 个 属性 是 相同 的 ， 所 以 连接 运算 匹配 这 一 
相同 的 列 ， 并 扩展 ORDERS 表 以 包含 客户 信息 。 然 后 投影 到 cordqno 和 cname 列 。 
如 果 我 们 能 够 在 连接 前 用 投影 去 掉 无 用 的 ORDERS 表 中 的 列 ， 结果 同 样 正确 : 
({ORDERS where dollars < 5007[ordne,eid] JOIN CUSTOMERS) 


[erdno.,cname] 


(e) (ORDOERS Where month = mar JOIN CUSTOMERS) [fordno,cname,aid] 
JOIN AGENTS) [ordno, cname, aname] 
注意 ， 与 前 两 个 练习 不 同 ,在 这 里 ， 第 一 个 投影 是 防止 根据 属性 city 连 接 而 发 生 不 必 
此 的 匹配 所 必须 的 。 这 是 因为 属性 city 区 出 现在 {GRDFRS where month ='mar' 
JOIN CUSTOMERS) 中 ， 叉 出 现在 AGFNTS 中 。 如 果 我 们 不 使 用 第 一 个 投影 以 去 际 city 
局 人 性， 那么 只 有 能 匹配 客户 的 city 和 代理 商 的 city 的 行 才 会 出 现在 结果 中 。 

(g} CPRODUCTS Where city = Duluth’ JOIN ORDERS 
where month = mar’ })ipnamel. 


同样 ， 在 连接 之 前 的 投影 不 会 影响 结果 ， 除 非 它 去 挤 了 pia。 


2.5 (a) (CCCUSTONERS TIMES AGENYS) TIMES PRODUCTS) 
where CUSTOMERS ,city = AGENTS .city 


OOD 
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人 {C) 


{e) 


(g)} 


and AGENTS.city = PRODUCTS.c1ty)[e1d, 37d,pid} 
由 于 笛 卡 儿 积 满足 结合 律 ， 所 以 也 可 以 使 用 不 指明 三 个 表 的 导 积 哪个 莱 积 先 
执行 的 方法 解答 : 
{CUSTOMERS TIMES AGENTS TIMES PRODUCTS) 


where CUSTOMERS. city = AGENTS. city 
and AGENTS city = PROOUCTS.city}[cid,aid,pid} 


{ (CUSTOMERS TIMES AGENTS TIMES PRODUCTS) 
where CUSTOMERS. city <> AGENTS.city 
and AGENTS_CTty 《> PRODUCTS, city 
and PRODUCTS .city <> CUSTOMERS .city)[cid.aid.pidl] 


你 知道 为 什么 需要 第 三 个 条 件 吗 ? xy 日 yc>z 并 不 意味 着 x<z。 例 如 : x, y=k, z=c。 


【DRDERS JOIN (CUSTOMERS where city 一 “Da17as")[cid] JOIN 
{AGENTS Where city 一“Tokybo" [ald] JOIN PRODUCTS}[pname] 


表 cUSTOMERS 和 AGENTS 的 投影 是 用 来 去 掉 city 列 的 。 这 样 ， 在 连接 时 city 
列 束 不 会 被 考虑 了 。 同 样 ， 我 们 设 有 用 括号 指定 四 个 表 的 连接 顺序 ， 这 是 因为 
和 笛 卡 儿 积 一 样 ，JOIN 也 满足 结合 律 。 


Al :™ AGENTS,. A2 := AGENTS 
(Cal x A2) where Altity = pp.City and Al.aid < A2.31d) 
{TAL .aid, A2.a1d] 


这 和 正文 中 我 们 只 希望 每 对 不 同 的 代理 只 出 现 一 次 是 类 似 的 。 


(中 如 末 以 前 并 不 知道 该 雇 窒 ， 此 题 是 比较 难 的 。 让 : 


C1: ~ CUSTOMERS, C2 :~ CUSTOMERS 
Xfcid1。cidy := 

(Cl TIMES C2)} where Ci.discnt >= C2.discnt) [Cl.cid, C2.c1d]. 

现在 ， 得 到 的 答案 正好 是 cidl 的 值 (在 左 ) 和 所 有 ciad 的 值 1 在 右 ) 所 组 成 的 
对 ， 即 包含 了 discnt 和 所 有 小 于 等 于 它 的 discnt 的 值 一 -所 以 最 终 答案 是 : 

x DIVIDEBY C[c1d]. 


为 了 找到 具有 最 少 折扣 的 客户 ， 只 要 把 上 面 的 >= 改 成 <= 就 可 以 了 。 


(Kk) (ORDERS where ORDERS.aid ~ “a03' }[pid] 


(m 


Te 


(0} 


-{ORDERS where OROERS.aild = ‘a06' )Eptd] 


首先 ， 我们 可 以 找到 不 订购 任何 Newark 的 产品 的 代理 TT; 

T :一 al11 agents ~ agents Who order products 十 站 Newark 

— AGENTS[aidj - (CO JOIN PRODUCTS where city ~ "Newark'}[aid] 

现在 ，(T JOIN AGENTS) [aid,aname] 加 上 了 aname 的 信息 。 于 是 ， 我们 
可 以 选择 这 些 aname: 

tT JOIN AGENTS) [Laid,aname] Where aname >= "N' and aname < ‘DOD* 

最 后 的 结果 是 通过 代 人 法 得 到 的 。 

设 B1 等 于 用 户 c002 订 购 的 所 有 产品 ， 即 1 : =(ORDERS where 
cid=' co002')[pial。 接 着 ， 我 们 需要 得 到 为 所 有 订购 P1 的 代理 ， 他 们 的 


i 


本 十 衣 和 从 S551 





让 i 为 - 
ORDOERSEa1d,. pid] DIVYIDEBY Pl 


所 以 ， 通 过 代 人 得 到 的 答案 是 : 


(CORDERSTaid,pid] DTYIDOEBY ORDERS where tid 一 "hoa [pid]i 
JOIR AGENTSY[aNname] 


这 里 ， 两 次 使 用 ORDERS 的 用 法 似乎 是 可 颖 的 ， 但 是 ,事实 上 它 不 会 引起 任何 
问题 ， 只 有 当 两 个 次 的 列 名 在 计算 中 要 一 起 被 用 到 时 才 澳 要 使 用 别名 。 
(q9) 是 的 ， 这 和 (b) 是 一 样 的 。 使 用 JOIN: 


(CUSTOMERS TIMES AGENTS TIMES PRODUCTSITCId, atd, pid] ~ CUSTOMERS JOIN AGENTS 
JDIN PRODUCTS}YL C1, a1dj, pid] 


(8) (ORDERS where dollars >》500)faid,cid] JOIN CUSTOMERS 
where city = "Kyoto'}[La1id] 
(u) 设 oY : = ORDERS， 日 0 : = ORDERS。 于 是 答案 是 : 
OLcidl - (0 X OF) where OQ.aid <> DY.aid and 0.cid = 0Y,cidirG.cid] 


在 剩 下 的 习题 解答 里 (2.6 到 2.15 ) 包括 很 多 键盘 形式 的 关系 运算 和 罕 ， 以 示范 它们 的 用 法 。 

2.6 (bj 在 定义 2.7.4 中 ， 如 果 没 有 相同 的 列 ， 那 么 在 两 个 表 中 B, 到 B, 就 不 存在 (k=0)。 于 是 ， 

在 定义 何 时 行 (在 表 R JOIN S 时 ， 我 们 应 该 忽略 对 列 B, 的 引用 。 于 起 ， 对 于 R TIMES S 

的 乘积 使 用 合适 的 列 名 代 换 ， 则 剩 下 的 定义 就 退化 B, 为 定义 2.6.4。 另 一 -个 论据 在 定 

理 2.8.2 中 ， 使 用 其 他 运算 符 来 表示 JOIN。 如 果 我 们 去 掉 对 列 B 的 引用 ， 那么 定义 的 

第 一 部 分 就 退化 为 =R TIMES 8S。 定义 T, 的 第 二 部 分 仅仅 是 重 命名 列 以 去 除 限 定 符 。 

2.7 通过 练习 2.6， 我 们 知道 ， 当 R 和 8 没有 公共 的 属性 ( 列 )} 时 ，R JOIN S 和 R TIMES S 

是 完全 相间 的 。 设 r 是 R 中 的 一 行 。 显 然 r 会 和 5 中 所 有 的 行 相配 以 枸 成 R TIMES S 中 的 某 些 行 。 
在 这 种 情况 下 ， 如 果 被 S 除 ， 我 们 就 又 能 得 到 r 了 。 从 中 我 们 可 以 看 型 ， 每 一 个 R 中 的 行 部 在 (R 
JOIN S) DIVIDEBY SS 中。 但 是 ， 如 果 另 一 行 xz 在 了 JOIN S) DIVIDEBY S 中 出 现 ， 这 意味 着 4 
在 (R JOIN S$S) 中 肯定 和 $ 的 所 有 行 相 配 ， 即 x 在 (R TIMES S) 中 。 但 是 ， 根 据 TIMES 的 定义 ， 这 
样 的 行 4 一 定 在 R 中 。 这 是 因为 内 有 这 样 的 行 才 会 和 S 中 的 行 相配 并 被 放 入 R TIMES S$ 中。 要 完 
整 、 严 蜜 地 证 明 需 要 形式 化 一 些 意义 不 明确 的 表述 ， 例 如 用 定 久 2.6.4 的 形式 表示 “r 和 S 中 所 
有 的 行 相配 ”:“ 对 于 R 和 S 中 的 相应 的 每 一 对 行 w 和 v， 在 R TIMES S$ 中 存在 一 行 5 满足 :R.Ai) 


2.8 (a) 设 N, 是 一 个 常数 表 ， 它 只 有 一 行 ， 所 有 值 为 null， 标 题 是 由 在 A 中 但 不 在 B 中 的 
属性 组 成 的 。 类 似 地 ，N, 是 在 B 中 但 不 在 A 中 的 属性 为 null 的 表 。 于 是 : 
ADB AdB NA x {tB — {APIABYL Headt B}]) wh — IAPABYCHeEad(tAy]} x He 

2.9 {a) 对 于 三 个 表 R、S 和 T， 在 表 和 表 之 同 ， 属 性 共用 有 很 多 种 可 能 : 可 能 是 R 和 S$、S$ 和 T 
或 者 T 和 S 之 间 有 共用 的 属性 。 市 且 有 些 属性 可 能 是 三 个 宸 所 共有 的 。R JOIN S 可 以 
得 到 在 R 和 $ 的 共有 属性 上 相同 的 行 。 而 人 JOIN S) JOIN T 可 以 得 到 在 T 和 R JOIN S 的 
共有 属性 一 -既是 T 和 R 的 共有 属性 ， 又 是 T 和 $ 的 共有 属性 一 -上 相同 的 行 。 显 然 ， 
结果 在 R -S、S -~T 和 T ~- S$ 三 个 属性 集 上 都 要 一 致 。 类 似 地 ，R JOIN (S JOIN T) 也 有 
相同 的 要 求 。 在 任何 一 种 情况 下 ， 结 果 行 都 是 把 R x S x T 中 的 行进 行 投影 以 去 挥 重 
复 (在 两 个 表 中 重复 或 者 在 三 个 天 中 都 重复 ) 的 列 以 后 ， 进 行 选 择 而 得 到 的 。 


562 者 据 此 局 理 、 疾 着 上 糙 雍 


2.11 表 9 where CC 包含 7 了 S 中 所 有 满足 条 忻 C 的 行 。 于 是 : 
r 在 (3 where C) 中 ， 当 且 权 当 r 在 SS 中， 而 且 对 于 Fr， 人 CC 为 真 。 
T 在 ((R where C1) where C2) 中 当 且 权 当 了 在 (R where Cl} 中 ， 而 且 对 于 r，C2 为 真 。 
(R where Ci) 是 民 中 使 C1 为 真 的 行 的 集合 。 
于 是 ,fr 在 ((R where Cl1) where C2) 中 当 且 仪 当 f 在 民 中 ， 旦 C1 和 C2 为 真 ， 
类 似 地 ， 其 他 表达 式 也 可 以 被 简化 为 同样 的 基本 形式 。 
2.13 ”通过 前 一 个 练习 ， 可 以 知道 兼容 表 的 连接 就 是 表 的 交 。 考 虑 在 R INTERSECT T 中 
的 尾音 +。 因 为 R 是 38 的 子 集 ， 所 以 R INTERSECT T 是 S$ INTERSECT T 的 子 集 。 
考虑 U DIVIDBY S$S 中 的 任意 xr。 这 意味 着 对 于 所 有 的 在 S 中 的 s，(x,s) 在 U 中 。 接 着 可 以 
知道 ， 对 于 所 有 的 在 R 中 的 s，(x, 5s) 在 U 中 。 这 是 因为 R 是 S$ 的 子 集 。 所 以 ，x 在 U DIVIDEBY 
R 中 。 
考虑 R DIVIDEBY V 中 的 任意 +。 这 意味 着 对 于 所 有 的 在 V 中 的 v，(x,v) 在 R 中 。 接 着 可 以 
知道 ， 对 于 所 有 的 在 VY 中 的 v，(x,v) 在 SS 中。 这 是 因为 RR 是 S$ 的 子 集 。 所 以 ，x 在 S$ DIVIDEBY 
V 中 。 
考虑 (R where C) 中 的 任意 x。x 在 R 中 ， 且 对 于 x，C 为 真 。 于 是 ，x 在 S$ 中 ， 而 且 对 于 x，C 
为 真 。 所 以 ，x 在 (S where C) 中 。 
2.15 (b) 对 于 在 (RU SJ)HJ 中 的 任意 r+， 在 RUS 中 存在 某 个 (x,x))， 所 以 (x,x) 在 R 中 或 者 5S 
中 。 当 它们 被 单独 投影 的 时 候 ，x 或 者 在 R[H] 中 ， 或 者 在 SIH} 中 。 所 以 它 在 它 
们 的 并 集中 。 类 似 地 ， 任 何 R[H]US[HI 中 的 x 在 R[H] 中 或 SIH] 中 。 所 以 存在 RR 
或 者 8 中 即 在 RUS 中 ) 的 某 个 (x,x) 投 影 为 -。 于 是 ，x 在 (RUSYH] 中 。 
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3.1 {a} select c.cid, a.aid, p.pid 
from customers cc, agents a,. products p 
Where c.city = a.city and a.city = p.city:; 


(ce) select c.cid, a.aid, p.pid . 
from customers C。 agents a,. products p 
where ccity <> a.city and a.city 《> p.city 
and ccity <»> pcity: 


注意 ， 即 使 其 中 两 个 条 件 为 真 ， 第 三 个 条 件 仍 然 可 能 为 假 。 所 以 必须 使 用 三 个 
条 件 的 与 (AND )。 
{e) select pname from products where pid in 
(select pid from orders where 


cid 14n tselect cid from customers Where city = "Dallas'y and 
aid in select aid from agents where city = Tokyo); 


从 中 可 以 看 到 ， 我 们 在 同一 个 WHERE 了 于 名 中 使 用 了 两 个 IN 条 件 。 我 们 还 可 以 
使 用 连接 来 达到 相同 的 目的 : 


setect distinct pname 
from products pp. Ohders CG, CUStoMers CC, agents a 
where p.pld = o.pid and oa.cid = ccid and cc.city = ‘Dallas’ 
and .aid = 5.a1d nd a.city = TOKkyoO'; 


TO nr 


3.2 


3.3 


(g) 


(i) 


(k) 
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select al.atd, a2.aid from agents al. agents az 
where al .ctty = a2.city and al.aid < BT 


select eid from Customers 
where discnt >»=all 
Lselect dischnt from customersy): 


select cl1d from customers 
where discnt <=al1] 
tselect discnt From customersy: 


select distinct pid from orders where aild 一 “3a031? 
and pid not in tselect pid from orders Where aid = ‘a06"}; 


(m) 表面 上 看 ， 似 乎 使 用 如 下 的 方法 就 足 驶 了 : 


(o) 


(gq) 


(a) 


(ce) 


《al 


【Cj 


select distinct a.ald, 8.aname from agents a, orders 0 
Where aname Tike NS" and a.aid = 0.8id 
nd -pid Not Tin tselect pid from products 
where city = "Newark"'): 


但 是 ， 事 实 上 它 仅仅 烈 出 了 提供 订单 的 代理 商 。 完 整 的 解 疹 应 该 是 : 


seElaect a.aid, a.aname from gents a where a.a8name 1ike “可 
and a.aid not fh 
{select o.aid from orders & Where o.pid in 
select pid from products where city = Newark")}: 


select distinct aname from agents a where not exists 
tselect * from orders x where x,cid = "CON2" and not exists 
{select * from orders 了 where y.aid = a.B1d 
and x.pid = y.pid)}: 


select cild, a1d, pid from customers Cc, agents a, products op 
Where ccity 《> a.city or .city «> p.city 
or B.City < pcity: 


select distinct aid from custonmers c, orders o 


where ccid 二 站 .cid 
and e.doT1ars > S00 and c.city = "Kyoto": 


select aid from agents where percent 2any 
(select percent from agents}; 


只 有 在 最 小 侦 金 汐 5 的 时 蛋 ， 引 用 的 查询 返回 和 {a) 相 辣 的 结果 。 此 后 ,结论 就 
可 能 不 成 立 了 。 

这 就 是 为 什么 我 们 在 图 2-2 中 说 :“ 某 个 时 刻 的 内 容 "。 它 也 通过 内 容 依 赖 一 两 个 查询 
对 于 同一 个 表 的 内 容 有 相同 的 结果 并 不 足以 保证 两 个 查询 是 等 价 的 ， 解释 了 例 2.7.6。 
我 们 知道 x in 交 和 =any y' 是 一 样 的 {其 中 y 是 由 于 查询 返回 的 一 组 值 ， 而 x 是 一 个 
简单 值 ) 但 是 ，'x not in yY 和 'not (x in 六 是 一 样 的 ， 而 mot (x =any YY 和 x not in 了 
是 不 等 价 的 。 这 是 因为 如 果 在 y 中 有 一 个 值 不 等 于 x， 则 x <>any Y 即 为 真 ， 但 是 只 
有 当 x 不 等 于 y 中 的 任何 值 的 时 候 ，mot (x =any 只 才 为 真 。 此 条 件 在 SQL 中 用 谓词 
x <>all y' 表 示 。 了 于 是 ，NOT ALL 和 <>ALL 是 等 价 的 ， 但 是 和 <=ANY 是 不 同 的 。 
正好 补 索 那些 例 3.4.7 的 查询 不 检索 的 行 的 查询 是 : 
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3.4 {a) 
《C] 

36 (a) 

3.7 (nD 
(0) 


select aid from agents where Percent :any 
t select percent from agents}; 


select distinct cid From orders,. agents 
where arders.aid = agents.ald 
and (tagents.city = ‘Duluth’ or agents ,city = "Dallas'): 


Select Al.,.., An from S$, T where S.A = Kk end 
SAA] — TBY and TB = Cand TB = 5.A37 


INITIALIRZE LIST L to 上 MPTY 
FOR T FROM ROW 1 TO LAST OF TABLE T {Ho alias) 
IF (T-Bz ~ ¢c) 
Place BI on [LIST 上; 
END FOR T; 
FOR S FROM ROW 1 TO ROW LAST OF TABLE 5 
IF tA» = 长 and A an element of LIST E) 
Place AT. A ON SOLUTION LIST M 
END FOR S$ 
PRINT GUT UNIOQUE ROWS ON SOLUTION LIST H 


sglect * from R union select * from $s: 


用 CROSS JOIN 昔 换 每 一 个 PRODUCT， 并 用 括号 把 UNIONS 和 DIFFERENCES 
中 的 子 表达 式 括 起 来 ,让 它 变 成 一 个 tableref ( 如 图 3-10 定 义 的 那样 )。 于 是 ， 
整个 表达 起 就 成 为 了 一 个 tableref T。 构 造 SELECT 语 各 select * from T。 
{(R UNION S) MINUS T 在 Full SQL-92 宕 示 成 为 ; 

Select * from CtR UNION 35) EXCEPT TY. 


(R UNION S) MINUS T 表 未成 基本 的 SQL: 考 虚 (R UNION S) MINUS T 中 的 一 行 
w。 它 在 R 或 中 ,但 是 不 在 T 中 。 假 设 它 在 R 中 。 于 是 ， 它 在 R 中 但 不 在 T 中 。 类 
亿 地 ， 如 果 它 在 S 中 ,那么 它 在 8 中 但 不 在 T 中 。 这 样 ， 它 在 RR -TT 中 或 $~T 中 ， 即 
它 在 (RT) UNION (S -人 了 中。 此 表达 式 可 以 用 习题 3.7(a) 的 结果 写成 SQL 形 式 : 


(select < from R where not exists select * from T 

Where R.A] = TAIBNY Rh = Thoiss: and R.An = T.An)) 
UNIOHNH 
Select * from $ where not exists tselect * from T 

Where SA = TALand S.A = TMD and S.An = T.Ar}} 


(e) 根据 定理 2.8.3， 


R DIVIDEBY 5 ~ REA1,..., An] - 【CR[A1，-.，， An] TIMES S) 

~ RCA, An] 
其 中 ，R 为 Select ciqd， aid from orders, 而 8 为 select aid from 
AJgents where city ='New York',. HEADIR) = Al...A, 
B,...B -ciog aid, 而 S=B,...B.=aid。 所 所 我 们 可 以 知道 , n=1, A,=ciq,， 
m=1，B,=aiq， 而 月 R[Iciqd] TIMES 8S ( 设 为 V ) 的 定义 如 下 ; 


¥ = select o.cid.a.ald from orders 0, agents a 
Where tity = "New York" 
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3.8 (a) 


3.10 {a) 


我 们 需要 的 最 后 结果 是 R[cid] - (V-R) [cid]。 根 据 习题 3.7(d) 中 的 MINUS， 
IY-RY = select o.cid, a.aid from orders Od,. dyerts a 
where city = Mew YoOrk” and not exists 


{select * from orders x 
where XxX.aid = a.a1d and x.cjd = 0o.cid) 


{V-R) [cid] 也 类 似 可 以 得 到 ， 只 要 在 选择 列表 中 去 掉 a .aid 就 可 以 了 .最 
后 ， 通 过 比 习题 3.7(d) 儿 使 用 一 次 MINUS， 可 以 得 淹 结 果 : 
splect cid from orders ¥ where not exists 
‘iselect o.cid from orders 0, agents a 
where city = New TOork” 
and not exists 
{select * from orders x 
Where XX.cid = o.cid and x.aid = 3.a1d) 
and -cd = Oo.cCid): 


事实 上 ， 这 样 返 回 的 结果 包含 了 重复 了 多 次 的 内 容 ， 所 以 要 求 使 用 select distinet。 
select cid, maxtdollars} as maxspent from orders 
group by cid; 
显然 ,这 是 一 个 外 连接 。 我 们 需要 使 用 WHERE C 来 从 10 个 客户 中 导出 一 张 表 ， 
假定 为 ctab。 然 后 把 ctab 和 sporders 右 外 连接 。 然 后 根据 cia 把 订单 求 和 。 
下 面 蚌 具体 的 步 聂 : 
1) 创建 导出 表 ctab: 


tselect cid, cname from tustomers where cy 不 二 本 雪 


2) 把 ctab 和 sporders 右 外 连接 ， 产 生 如 下 的 表 引 用 ， 


{select cidg, cname from customers where Cc) ctab 
Tight join sporders on ctab.cid = sporders.cid 


3) 在 最 终 的 查 诲 中 使 用 表 引 用 
sefect eid, chame, sumtdollars) as totdoll from 
ttselect cfd, cname from customers where &}) ctab 
rioght join sporders on ctab.cid = sporders.cid) 


group by cid. cname; 


注意 ， 在 GROUP BY 列表 中 ， 我 们 需要 使 用 cname 以 使 它 可 以 出 现在 选择 列表 中 。 
有 了 时, 它 可 能 为 nul， 但 是 那 没 有 关系 。 不 会 因为 有 为 null 的 cname 而 引起 一 些 意 
外 的 情况 一 不 会 存在 一 个 茎 为 null 又 为 非 null 的 cname! 在 ORACLE 中 ， 我 们 可 
以 使 用 导出 表 ctab 作 为 表 引 用 来 进行 单 向 连接 。 我 们 使 用 (+) 来 表示 不 保留 的 一- 
边 。 在 此 ， 我们 要 保留 在 sporders 这 一 边 的 行 ， 所 以 我 们 把 +) 放 在 ctab 一 边 。 
select cid, cname, sumtdollars) as totdoll from 

{select cid, cname from customers where C} ctab. sporders 


Where ctab.cidit+} = sporders.cid 
group by cid, cname 


我 们 可 以 用 内 连接 和 额外 行 的 并 来 模拟 外 连接 。 
1) 构造 内 连接 : 


Setect cid, cname. sumtdotlars) as totdoll from customers ¢, sporders 
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where C and ctab.cid = sporders.ctd 
group by cid, cname; 


2) 表示 外 连接 中 在 sperdaers 中 但 不 在 ctab 中 的 额外 的 行 : 


seElect cid, null, sumidol ars) as totdoll from orders 
Where cid nat in (select tid from customers where CC) ctab 


3) 把 第 一 步 和 第 二 步 的 结果 并 《UNION ) 起 来 。 


3.11 {a) seiect atd, pld, sum(qty) from orders group by atd, pid:; 


{C) select a.aid from agents a where not exists 
{select oO.* from orders 0, customers c, products p 
where o.aid = a.3id and o.cid = ccid and o.pid = p.pid 
and Cc.city = Duluth” and p.city = Dallas")}: 


(e} select distinct cid from orders o 
Where aid in ("a03° , a0} and not exists 
(Select * from ordars x where 
o.cid = x.cid and x,aid not in £03,. "a05'}); 


(2) select aid from agents 
where parcent = (select maxtpercent) from ayernts): 


{1) update agents set percent “= ll Where ansme = "Gray": 
select * from agents: 
update agents set parcent = 6 where aname = ‘bray: 
Select * from ayants: 


(kK) $lect cid, Sumtdollars) from orders where ai1d = “a0d" 
and cid not tn {select cid from orders 
where atd <> "a04) group by cid: 


{Im) select o.pid from orders 0, customers c, agents a 
where G.c1d = ce.cid and 站 -ad 二 Hd1d and ecity = a.city; 


3.12 (a) select discnt from customers where city = "Duluth’; 


disent 


nr 


t2 rowsy) 


select percent from agents where city 14ke NS"; 


Percent 


1 rows) 


select tity from customers Where discnt > 一 站 1 ] 
{select discnt from customers where city 一 “DuUYUth ) 1 


它 1 EY 


3.13 {a) 


CC) 


3.14 {a) 
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Dallas 


{2 rowsy 


select city freom agents where percent >any 
(seTect percent from agents where city like 'N%*):; 


mw- 一 


{1 rowy 


sglect city from customers where discnt >=sl| 
tsetect discnt from customers Where city = Duluth"} 


un 1d 
select clity from adgents where percent 2any 
‘(select percent from agents Where city like “We"); 


(3 rows) 

通过 定义 可 以 知道 , 超 键 是 值 可 以 唯一 地 确定 每 一 行 的 列 的 集合 : 在 这 些 列 上 ， 
没有 两 行 的 值 是 一 样 的 。 这 样 ， 如 果 我 们 从 表 中 选择 包含 超 键 的 列 ， 那 么 ， 结 
果 中 任意 两 行 都 是 不 同 的 。 

这 一 命 匡 不 为 真 。 旭 下 查询 


5B1Ect COUNtI*} from table group by <key>: 
( 其 中 <key> 为 包含 表 的 任何 一 个 超 键 的 列 的 列表 【用 喜 号 分 隔 )) 总 是 产生 一 张 
和 了 原 表 一 样 长 度 的 表 。 该 琢 只 有 一 列 ， 且 每 行 的 值 都 为 1。 


select * from customers where cname > 二 A” and Cname < ‘Bd’: 


3.15 (a) 在 外 连接 中 ， 对 于 每 个 没有 订单 的 代理 需要 有 一 行 ， 对 于 每 个 在 agents 表 中 


没有 对 应 aname 的 aidqa 的 订单 需要 有 一 行 : 


selett Baname, ,6id. SUumtx .del lars) rom et 辣 六 庆 站 和 有 区 
where a.aid = x.aid group by a.aid, .name 

union 

select aname, aid, 0 from agents 
qhere atd noat tn CSelect aid freon orders) 

union 

select ‘null’, afd, sum{tx.dollars?) from orders x 
where aid nat in (select aid from agentsy group by aid: 


3.16 (a) 管 : 它们 构成 了 单独 的 组 。 输出 为 ; 


percent 
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tf rows) 


人) 人 名 “获得 佣金 等 于 或 高 于 所 有 Geneva 的 代理 商 的 佣金 的 代理 商 的 和 名字”。( 辐 和 null 

的 比较 结果 为 UNKNOWN， 所 以 返回 0 行 。 在 Geneva 根 本 没有 代理 商 的 情况 下 ， 

结果 将 列 出 所 有 的 代理 商 ( 见习 题 3.14 )， 所 以 ， 空 值 的 存在 将 会 严重 影响 结果 。 
3.17 (a) 该 查 向 退回 所 有 的 顾 宅 ID，。 
3.18 (a) 使 用 ORACLE 的 floor0 甘 数 : 


create table buckets Chbuckat int. primary keytbucket}); 
Tnsert 1into buckets select distinct floortidollarsSo0) from orders; ~" ORACLE 
select bucket*s00 as "range-start"”, sumtdollars) from orders 中。 buckets b 
where floorio.dollars/500} = b.bucket 
group by b.bucket: 
drop table buckets:; -- Only needed for query 


对 于 使 用 CAST 的 系统 ， 可 以 使 用 CAST(dollars/500 as inb) 来 代替 floor0) 。 

3.19 (pb) 中 值 可 以 利用 产生 数据 的 累积 直方 图 的 能 力 来 直接 计算 。 也 就 是 说 对 于 每 个 值 ， 
计算 小 于 该 值 (或 者 等 于 它 ) 的 值 的 个 数 。 对 于 orders 表 中 的 dollars， 累 
积 直 方 图 可 以 用 旭 下 的 高 级 SQL 查 询 来 产生 : 


select h2,.dollars, Sum(tct) from 
(select dollars, countidollarsy ct from orders group by do11ars) hi, 
{select dollars from orders group by dollars) hz 
where hli.dollars <= h2.dollars -- Over all hl values <= h2 value 
group by h2.dollars ， 
order by h2.dollars: -= just for reporting 


内 部 的 两 个 子 查询 把 重复 的 9ol1lars 数 值 精简 为 值 的 计数 ， 以 避免 连接 时 重复 行 所 引 
起 的 习 法 效应 。 现 在 ， 我 们 把 得 到 的 渐 增 直方 图 表 用 符号 8 表示。 它 的 列 为 dollars 
和 ct。 在 这 里 ，ct 是 在 orders 表 中 小 于 等 于 某 gollars 值 的 计数 。 对 于 中 值 ， 我 们 
需要 得 到 ct 的 中 间 点 ， 即 orqers 表 中 ct=maxfct)y72=count (dollars]) /2 的 
dollars 值 。 但 是 ， 我 们 不 太 可 能 得 到 淮 和 确 的 号 配 。 所 以 ， 我 们 要 得 到 的 是 大 于 等 于 
count (dollars) /2 的 ct 值 中 最 小 点 所 对 应 的 dol1lars: 


select dolltars from 下 
where Ct = (Select mintctl) from 下 
where ctl Y= {select counteir yi2 from orders)) 


把 两 次 出 现 的 F 和 替换 祥 ， 我 们 就 得 到 了 完整 的 查询 。 它 包 合 两 后 的 FROM (于 查询 ): 


{5elect dollars Frm 
{tselect h2,.dollars, sumthl.ct} from 
(tselect dollars, counttidollars) ct from orders group by dolarsy hl, 
(select dollars from orders group by dollars) he 
Where hl.dollars <= hz2.dollars group by h2.doliars} 下 
where ct = (select maxtcti) from 
(select dolTars, countidollarsy ctl from orders group by dollars} hl, 
{select dollars from orders group by dol1ars) h2 
whare hl.dollars <= h2.d01]ars group by h2.dollars) F 
Where ctl y= {Select counte* /2 from orders]}): 
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第 4 章 习 题解 答 


4.1 


.2 


(a select ssno From People Pp Where Pp.pname.mi 15 null; 


(ce) select pl.ssno, p2.ssho from people p. paople pl 
where pl.priame = Pp2.phname and pl.ssrno < pe.ssho: 


ta) ORACLE: 


create type student 七 as object 【 
sperson person t+, 
stuid int, 
emailname varchart30), 
gradyear int 
下 
create table students of student t isperson net null. primary key stuid}): 


INFORMIX: 
create row type Student 二 【 
spersen person t not null, 
stuid 1nt., 
emailname varchart3D;, 
gradyear i1nt 
了 
create table students of type student t (primary key {stuld)}); 


4.3 (a, c, gi, q) 它们 与 orders 表 无 关 ， 所 以 不 能 使 用 REF。 这 是 因为 所 有 的 REF 都 在 


4.4 


家 corders 中 。 


(e) select distinct o.ordprod.pname from orders 日 Where o.ordcust.city ~ ‘Dallas’ 
and o.oordagent .city = ‘Kyoto’; 


{g, i) 与 orders 表 无 关 。 
(Kk) 只 和 orders 家 有 关 ， 不 需要 REF。 


(mm) select aid. aname from agents a Where a.aname like “N%" 
and a.aid not in 
{select a.a1d from orders 0 where o.oordprod.city = “Newark"): 


{0) 为 了 去 掉 没 有 任何 订单 的 代理 商 ， 我 们 应 该 在 第 一 行 中 使 用 from orders: 
select distinct o.ordagent.aname from orders 0 where not exist 
Select * from orders x where x.cid = 002 ”and not exists 
(select * from orders Y where ¥.ordagent ~ refta) 
and yordprod = Xx.ordprod}) 


(8) select aid from orders oO where do11ars > 500.00 and .0rdeust.city = ‘Kyoto”: 
{u) select cid from (select distinct cid, aid from TdT 二 】》 著 


group by cid having countt*} ~ 1: 


[ay DORACLE: select e.dependents from employees e 
Where 1 = (select count(t*) from tablete.dependents})}: 


INFORMIX: select e.dependents from employees e 
Where cardinalityte. dependents) = 1; 
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(ce) ORACLE: select countt*y from phonebook ph 
where i100 in Cselect * from tabletpb.extensions}),; 


IMFORMAIN: select countit*y From phonebook pb 
where 100 tn pb.extensions.; 


4.5 (2) ORACLE RINFORMIX: select eid from employees e where e,fname in 
(select tfname from tablere,.dependents}) 十 


(Cc) ORACLE: select valuetd) from table 
{select ea.depandaents from employees e where e.eid = i190) d 


Where 二 .ae = 
{select maxtage) from tabletselect e.dependents from 
emplorees e where e,eld = 100)): 


INFORRMIN: select d from table 
(tselect e,dependents from employees 已 Where e.eid = 100) d 


Wher d.age = 
{Salect maxtagey Trom table (select e.dependents from 
emMpToOrees e where eB.efd = 100)}).; 


(e) 我 们 可 以 在 类 似 于 例 4.3.13 的 查询 中 使 用 <SOME 和 >SOME。 但 是 一 种 更 普通 的 办 
法 是 在 内 部 扫描 extensions 表 针 使 用 条 件 “where extension is between 800 and 
900”"。 但 是 ,在 两 种 产品 中 ， 我 们 都 会 碰 到 一 个 问题 ， 对 内 部 extensions 表 的 
那 一 列 并 没有 指定 列 名 。 在 两 种 产品 中 解决 这 个 问题 的 办 法 是 完全 不 同 的 。 在 
ORACLE 中 ， 当 没有 指定 列 名 时 ， 可 以 使 用 通用 名 column_value。INFORMIX 
支持 SQL-99 的 语法 ， 它 允许 像 在 ableref 形 式 {图 3-11 第 一 行 ) 中 的 表 那 样 指 
定 新 的 列 名 。 所 以 ,我 们 可 以 在 查询 中 提供 合适 的 列 名 例如 下 面 的 ext )。 


ORACLE: select pb.phperson.ssno from phonebonk pb 
Where exists tLselect * from tabletpb. extensions) 
where column_value between S00 and 900}; 


INFORMIN: select pb.phperson.ssno from phonebook pb 
where exists(select * from tabletpb.extensions’) 
as XtEXLTY -- tolumr rame “ext™” added here 
where x.ext betwean 8300 and SDN): 


4.6 (a ORACLE: 


salect BP. Pr, COUNntiy 3 Ct From points Pp, rects r 
where rinsidetvaluetp})} > 0 
group by p.x, Pp.yY 
having countt*)>3 
order by countt*): 


IMFORMIX: 
select p, countt*) as ct from points p. rects r 
wherte tnsidetr,Ppy 
group by Pp 
having count{*})»3 
order by count(t*); 
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《CT ORACLE: 


select valuetp) from points p, rects r 
where r.insidelt valuerp)}>0 and .areat yi 一 
{Select maxtr.areart}} from rects ry): 


INFORMIX: 
select Pp from points p, rects r 
where 1nsidecr,p) and areatr}= 
tselect maxtareatr}) from rects r}; 


村 .了 select valuetp), valuetr), {rpt2.x-r.ptl xXx)*r. pte yr PE Cn 

rects Fr, points Pp 

where tr pte, x-r ptl.x}*tr. pt yr.ptl.y) = 
(select mn(iril, pte, x-ri ,pil Xrl pt2.y-rl.ptl,.y)) from rectangles rl 
Where px = rl.pti,x and px <= rl.pt2.x and 
PY Sm rl.ptl.y and pay C= Fl.pte,y) 

Bnd BK Pe Fmt nd Bn <= PPt2% and py Ye TBEYLY Bnd py Sm PPL 
order by p.x, Pp.Y¥: 
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注意 ”大 多 数 程序 都 使 用 文件 prompt .c 以 及 相应 的 头 文件 prompt .h。 请 参考 附录 BB 
“编程 细节 ”以 讨 得 更 深入 的 讨论 以 及 函数 promptO 和 函数 print_dberror0 的 代码 。 


与 之 


/i ORACHE version: program to report on product quantities by agent for cid and pid */ 
#define TRUE 1 
#include <stdio.h>» 
#include <string.h? 
#inciude “prompt.h™ 
exem sgl inciude sqlca; 
mainet) 
{ 
exec sol begin declare section; 
char usernameL?0], password[20]: 
char cust_idf5], product_ 1d[#4], agernt_id[#]): 
long total_oty: jr sum of shorts may Need 1ong */ 
exec S91 end declare section: 
char promptcidpid[L] = "PLEASE ENTER CUSTOMER ID AND FRODUET iD: ”; 
exec SIO1 declare agent. qty cursor for i* declare cursor 二 
select aid,. sum(tqty} from orders 
where cid = :cust_id and pid = :product_id 
group by aid; 


strcpyiusername. "scott™) ; in set up for 二 

strepytpassword. "tiger™); tr ORACLE lo0gin nf 

eXxet Sql connect :username 1dentified by :password; /* DORACLE connect bid 

while tprompttpromptcidpid, 2, cust_id.arr, 4. product id.arr. 3 >= OY { 

exec Sql whenever sqlerror goto report_error; i Error trap conditicn -if 
ExXEC SI pen agent_ qty; 二 OpeEN cursor tf 


exec Sol whenever ot found goto fetctdone: 
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while CTRUEY { /i* loop to fetch raws 二 
exec 59l fetch ageEmt qty 1nto :agent_id, :total_qty: 
Printf{"%s %din”, agent id, total_aqty)}: /A* display row 
} 
fetchdone: 
exXEC Syl close agent_ qty: 1* Close cursor when fetches done 二 交 
eeEC SHl ceommit work: fi* Felease Fead 10cks wi 
} Ff* end of prompt To0p: repeat wf 
让 其 ec S50 commit release:; i DRACLE disconnect from Gatabase */ 
return 0; 
report_arror: 
print_ dherrort(}; A* print out error message Rf 
后 X Sq rollback release: fa ORACLE faflure disconnect id 
return 1: 


] 


5.6 (d) 如 有 染 在 读 以 后 进行 提交 ， 那 么 这 些 读 的 内 容 在 更 新 之 前 有 可 能 发 生变 动 ， 从 而 
引起 检查 所 要 防止 的 问题 。 例 如 ， 人 保持 存货 总 数 为 非 负 的 。 所 以 ,在 其 中 没有 
其 他 地 方 可 以 加 入 额外 的 Commit。 

3.10 


i .10, OB2 UDE version: Histogram of dollar amounts of orders */ 
#derine TAUE 1 

#define RANGE SOU.O 

#include <stdio.h> 


BXEC S01 Theclude sqilca: 
maint} 


i 
Exec sql begin declare section: 
touble dollars: 
Exee S91i end declare sections; 
double range start ~ 0; 
doub1e range end = Tange Start + RANGE : 
double range_sum = 1 .0-: 
Bxec 9] declare dollars_cursor cursor for 
select dollars from orders 
order by dollars: 
exec sgl whenever sqlerror aoto report_error: 
exec sql connect to testdb: i* DB2 UDB cormect te databise id 
exec Sql open dollars_tursor: 
exec sql whenever not Found goto fetchdone: 
printft"™®-i7s %-Bshn", "range”, "total orders™}: 
while CTRUEY i i* 1o00p over orders table wp 
exec S59 fetch doliars_cursor into :dollars; 
4f Cdollars < 下 间作 上 全 二 和 本) 区 


range_Sum +™= dollars: i point in same old range A 
} else { i* point beyond end of this range np 
whilet dollars > range_end} { tr -=- and possibly several ranges A 


printfe"%a.2f-%B8.27 %9.2F\n", range_ start.range_end, range_sum}: 
Fange. Sum = QQ: 


玉 了 历 衣 从 


range, Start = range_end: A* step Fange 
range_end t= RANGE; 
} 
range_ sum += dollars,: i found mew range that fits point 
} 
] fs end while loop on a1d values 
fetchdone: 


if Crange, Sum 
printft"%e,. 27-%8.2f Ya.2f\n™", renge start, range_ end, range_ SuUmy 
SXEC S91 Close dolanrs_ cursor; 
EXec Sql commit work; i* release locks 
Exece Sol disconnect current: 
return 0: 
report_error: 
print_dberrort}: A print out error Messaye 
exec sgl rollback work: A* failling, Undo work, end locks 
所 其 自习 1 disconnect current:; i Disconnect from database 


return 1: 


} 


53.12 (a} ExXEC SI begin declare section: 
char cityL?l1]: 
exec S91] End detlare sections:; 


(by exec 59l declare ce cursor for 
select distinct a.city from agents 8, orders x, products p 
where a.aid = x.aid and x.pid = ppild and Eprice < 1.00: 


A 


*f 


ws 


二 


wi 
wf 
wf 
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当然 也 可 以 使 用 子 查询 。 使 用 条 件 x .dollars < 1.00 列 出 products 是 一 
个 常 抑 的 错误 。 使 用 该 条 件 根本 不 能 显示 产品 列表 。 因 为 它 不 是 问题 的 解答 。 


(ce) while 1}t i or while TRUE, assume TRUE ~ 1 
exec Sq whenever not found goto fetchdone; 
exac Sql fetch ce tnto :city; 
printf ("Es", city); 
] 
fetchdone: 


1.13 (a) iftsqlca. sqlcode 一 100) gote &rTor handTe; 
tb) iftsqglca.soqlcode < 0) goto error_hand1e: 
S.14 {a) select ce.city, Cid, aid, pid from customers c, agents a, 


products p 
where CCfty = a.city and a.city = pcity order by ccity:; 


= 


号 成 group by c.city 是 一 个 常见 的 错误 。 因 为 目标 列表 中 的 其 他 元 素 对 于 
不 同 的 c .city 值 并 不 是 单 值 的 这 种 写法 当然 是 不 合法 的 ， 根 据 c .city 排 序 保 


证 了 来 自 同一 城市 的 结果 行 只 出 现 一 次 。 
(b) 30 x 10x20=6000 


{c) 基本 的 思想 是 避免 打印 New York 的 6000 行 。 我 们 希望 打印 “New York”， 然 后 


是 三 个 city = New York 的 customers, agents 和 products 的 cid, aiqd、 
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pig 的 值 的 列表 (不 重复 )。 我们 希望 对 每 一 个 城市 都 如 此 ， 最 后 结果 一 个 接 一 
个 地 输出 。 我 们 不 要 求 写 严 格 的 C 程 序 ( 伪 代码 就 可 以 了 ), 但 是 必须 要 能 够 显 
示 如 何 使 用 嵌 人 式 SQL 来 完成 此 任务 。 从 声明 需要 的 游标 开始 ， 我 们 在 伪 代 码 


中 省 略 exec sdql。 


器 冯 让 ar Citias cutsor For delect distinct CC.eity 
from customers ¢, agents a, products p 
where Ccity = -City and a.city' = p.city: 

declare tids cursor for select eTtd from customers 
where City = :city; 

declare alds cursor for select ald from agents 
where city = :city; 

declare pids cursor for select pid from products 
Where City = :city.: 


open cities; 
while f rows remain in cities); +{ A 1oop to fetch citynames 


fetch cities into :city; re city velue to open other cursors 
print cityname header: 
0pen cids: 
Taop to print out cid values of cursor cids; 
opern aids; 
loop to print out aid values of cursor aids: 
open pids; 


oop to print out pid values of cursor pids; 
】 i* 100p while cities remain */ 


这 是 只 使 用 一 个 游标 常见 的 错误 , 例如; 


declare Ces Cursor For select ct.clty, cid, ai1d,. Pid 
from customers ¢, agents a. products p 
where ccity = a.city and pcity = a.city order by .city: 


然后 ， 使 用 如 下 的 程序 逻辑 : 


站 Pen Ces: 
fetch first row of ces into :eity, :cid, :afd, :pid: 
Femempber city name as oTdcity: 
print city name header: 
start printing columns of cid, aid, pid values 
while Crows From ees remain} ( 
if latest City does not mateh oldcityt i stort new Dldcity 
remember new city name as oldcity: 
print new city name header; 
start printing columns of cid, aid, pid values: 
] 
else { i* same Oldcity name */ 
print Out new values of cid, aid, pid in columns: 
} 
] i next row of ces */ 


* 
«yf 


机 


但 是 这 种 方法 并 不 能 达到 限制 信息 数量 ( 行 数 ) 的 目的 。 因 为 仍然 将 有 6000 行 币 条 


印 。[ 问题 是 New York 对 应 的 cid 值 列表 中 有 很 多 重复 值 ,) 


5$.]5 (a) exec sql declare topsales cursor for 


select pid, sumtdollars) totdollars from orders 
group by pid 


order by totdollars desc; A/* or "order by 2 desc™ in seme older systems*/ 
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(by int count = 0 A* count 10 rows to print out “jf 
while {£171 


Whentver not found goto fetchdone: 
fetch topsales Tnt :pid, :doltot: indicator :dolind; 


if rdoldnd >= O01{ A not a null value, so Count it */ 
ift++count >= 101 
break; A* have already printed 10 rows ny 


printft"pid value is %s, total dollar sales 1s Fs ", 
pid, doltot}); 
1 i* end if */ 
] f* end loop */ 
fetehdone: 


5.16 ”我 们 不 需要 在 第 一 次 访问 之 后 测试 死 锁 。 这 是 因为 不 可 能 发 生死 锁 《〈 虽然 如 果 测 试 
不 会 有 什么 害处 ) 最 重要 的 是 在 磋 到 死 锁 的 时 候 释 放 所 有 的 锁 。 一 个 常见 的 错误 是 仅仅 循环 
来 试 着 进行 第 二 次 访问 而 不 进行 回 退 。 


#define DEADABORT ... ， fill in for your System 二 
exec SO whenever 5S9q1error continue; i WETre taking Over error handling 二 7 
int count = 0; 

while 11) 


exet Sql Update orders 
set dollars = dollars - :dalta 
where aid = :agent] and pid = :prodl and cid = :custl. 
if {sqlca.sqlcode < A) 
goto handle_err;: i can't be deadlock yet np 
pxec Sql updete order's 
set dollars = dollars + :deita 
Where aid = :3gentl and pid = :prodl and cid = :custl: 
if CSqlca,sqlcode w= DEADABORTY{ 
iftcounttt+ < zy) { 


全 Xe S091 rollback; i* Need to drop locks held 二 
i* here, call OS to wait for a second, sleeptl) on UNIX 二 7 
cont1inue: i* try again a 
]】 else 1 
exeEc Sq rollback: 
break:; i* give up entirely wi 
} 
1f {sqlca, sqlcode < 0) goto handle_err; /* other error? rf 
BAEC S91 commit work: Aw 1f not, commit wy 


} i* end of Toep of trials */ 


5.17 (a) ORACLE: for i-0;1<sqlda->N;i+) 
printft™®*s “.sqlda->M[i] , 591da->S[t]) 
printft™n™) 


DE2 UDB: for (1-0;1¢<5qlda->sq1d:1i++} 
printft "rs ", sdlda->sqlvar[Li].sqlname. length, 
sqlda->sqlvar[i].sqlname ,iengthy， 


(Pb) ORACLE:: if(*(sqlda -> I[1]}) 
handie_nuilr}: 


DBz UDB: if (*(sq1da->sq1var[1].sq1indy) 
handle_nullt}: 


注意 ， 检 测 空 值 的 条 件 是 指示 器 sqlind 是 否 是 TRUE， 妈 在 C 中 测试 其 是 否 为 一 个 非 0 值 。 
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第 6 章 习题 答案 


6.1 ”在 四 种 可 能 性 (min-card=0 或 1，max-card=1 或 N} 中 只 有 两 种 是 真正 的 约束 : min- 
card=1] 《不 允许 为 0) 和 max-card=1 (不 允许 天 于 1 )。 如 果 在 茶 种 情况 下 打破 了 约束 ， 那 么 我 
们 就 知道 该 约束 不 是 普遍 遵守 的 了 。 于 是 ， 在 图 6-6 的 (a) 中 ， 因 为 它 属 于 这 种 情况 下 ， 我 们 可 
以 确定 min-card(E,R)=0， 而 且 min-card(F,R)=0。 但 是 ， 我们 不 能 确定 max-card 的 情况 。 在 (b) 
中 ， 我 们 可 以 确定 min-card(E,R)=0 和 max-card(E,R)=N。 但 是 我 们 不 能 确定 card(F,R) 的 情况 ， 
这 是 因为 没有 实际 的 约束 被 打破 。 在 (c) 中 ,我 们 可 俯 看 到 min-card(E,R)=0,， max-card(E,R})=N， 
min-card(F, 有 R)=0， 雇 及 max-card(F,R)=N。 即 没有 实际 的 约束 成 立 ， 这 十 因为 所 有 可 能 的 约束 
都 被 打倒 了 。 

6.2 ”一 个 可 以 接受 的 E-R 图 参见 图 7-2。 注 意 ， 属 性 所 标注 的 基数 的 min-card 值 基本 都 是 
任意 的 ， 除非 十 主键 ， 主 键 的 基数 必须 为 (1,1)。 我 们 试 着 把 和 F 通 过 动词 关系 相 联 系 的 实体 E 
误 到 实体 F 的 左 俩 或 者 土方 。 这 样 ，Orders ships Products 和 Orders 在 在 边 ， 而 Agents places 
OQrders 和 Agents 在 七 面 。 

6.4 {a) 合法 的 。 

(cj 违反 了 阔 数 依赖 (3)。 

6.5 我们 先 考虑 只 有 -- 个 属性 在 左 侧 的 FD。 除 了 同一 性 函数 依赖 以 外 ， 还 有 如 下 几 点 : 
(a) A 列 所 有 的 值 都 相同 , 所 以 对 于 任何 列 和 六， 永远 不 会 发 生 r,(XX)=T(X)， 而 f(A} 关 IA(AA) 的 情况 。 
于 旺 我 们 可 以 看 到 B 一 A，C 一 A 而 且 D 一 A。 同 时 ,不 存在 其 字 列 X 肾 数 人 依赖 于 A， 这 是 因为 它 
们 都 至 少 有 两 个 不 同 的 佣 ， 以 至 于 总 有 两 行 r, 和 Tr 满足 当 r/({AY=r,( 太 A) 时 r.(XX) 关 fA( 儿 )}。 于 是 ， 
APB, 和 PC 目 A 六 了。(fb) 因为 所 有 的 C 的 值 都 是 互 不 相同 的 ， 所 以 除了 上 面 知 道 的 C 一 
A 以 让， 还 有 C 一 B 且 C 一 D。 同 时 ， 忆 并 不 函数 依赖 于 其 他 列 ， 这 是 因为 所 有 其 他 列 都 至 少 有 
两 个 相同 值 。 所 以 ，B Am C 和 D -Am C 是 新 得 到 的 FD。(e) 我 们 有 BD (因为 第 一 、 二 行 ) 和 
DB (因为 第 一 、 三 行 )。 所 以 ,我 们 可 岂 列 出 所 有 有 一 个 属性 在 左 侧 的 FD (前 面 括号 中 的 
字母 表示 其 是 从 上 面 第 几 项 得 到 的 )。 


ia AB (a) B- A l(a} 忆 二 二 l(a) 也 一 名 
(1 点 -六 已 {biBAC { 的 二 一 下 tiDE 
从] 态 访 口 ‘iw BHD ibjiC—=D 人 已 


这 样 ， 我 们 得 到 了 非 平 几 的 FD; (1) C 一 A B D，(2) BA 以 及 (3) D 一 A。 现 在 ， 我 们 考 
虑 在 左 侧 有 两 列 的 情况 。(d) 因为 C 确 定 所 有 其 他 的 别 ， 显 然 包 含 C 的 任何 列 对 都 能 确定 所 有 
其 他 列 ， 但 是 这 些 者 是 平凡 的 结果 。(e) 列 A 和 任何 其 他 列 X 在 左 侧 相 结合 仍然 只 能 蚂 数 决定 X 
所 能 决定 的 列 ( 因为 加 上 A 以 后 ,没有 其 他 新 的 不 同行 对 产生 )。 现在 ， 仅 有 的 不 包含 A 或 C 的 
列 对 是 BD， 而 且 因 为 BD 在 每 一 行 的 值 都 是 不 同 的 ( 请 再 看 一 下 表 T )， 所 以 我 们 知道 BD 一 性 
意 列 。 我 们 已 经 从 非 平 凡 FD 中 知道 (2)B 一 A， 而 且 BD 一 了 BP 是 平凡 的 ， 所 以 能 够 从 中 得 到 的 仅 
有 的 新 的 FD 是 (4) BD 一 C。 如 果 我 们 现在 考虑 三 列 的 情况 ， 显然， 任何 不 包括 C 的 三 列 (所 以 
函数 决定 所 有 其 他 列 ) 必定 包括 BD ( 所 以 函数 决定 所 有 列 )。 所 有 的 非 平 几 FD 为 : 


{ll} 二 ABD, (2) 了 一 点 ， [3 — A, ‘41 BD Ci 


6.7 (al 不 是 阿姆斯特朗 表 ， 最 后 一 行 在 讨论 中 设 有 出 现 ， 可 以 被 删 掉 了 ， 
6.9 ”合并 规则 ， 如 果 XX 一 了 Y 且 X 一 Z， 那 么 XYZ。 通 过 XX 一 YY 和 增 广 律 ， 可 以 得 到 XX 一 
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YX。 查 是 ，XX=X， 所 以 和 一 XKY。 类 亿 地 ， 在 X 一 Z 中 加 和 X 可 以 得 到 X 一 XZ。 
接着 ， 通 过 加 站 ， 获 得 XY 一 XYZ-。 接着 和 一 XY 和 XY 一 XYZ 意 昧 着 X 一 XYZ。 但 是 YZ 是 
XYZ 的 子 集 ， 所 以 通过 包含 律 ，XY 一 YZ， 而 根据 传递 性 ，X 一 YZ。 
伪 传 递 性 :如果 XX 一 Y 了 而 昌 WY 一 Z， 那 么 ，XW 一 Z。 根据 增 广 律 X-=>Y 可 以 得 到 XW 一 
YW ， 而 且 根 据 传 递 性 以 及 WY 一 Z， 可 以 得 到 XW 一 Z。 
6.11 (a) 假设 X+ 不 等 于 义 ， 那么 在 X+ 中 有 一 个 属性 A 不 在 XX 中 ， 使 得 X 一 和 A( 否则 我 们 使 
用 FD 就 得 不 到 和 XX 不 同 的 X+ 》。 此 FD 被 F 所 覆盖 ， 所 以 A 在 F 中 某 个 元 素 的 右 侧 ， 
而 左 侧 为 XX,。 因 为 X 并 不 包含 任何 左 侧 的 内 容 ， 所 以 ， 必 定 有 菜 个 非 平凡 的 六 
中 的 属性 集 B 不 在 义 中 。 于 是 ,X=BX，BX 一 A 日 X 一 A。 但 是 ,这 意味 着 人 ,并 
不 是 最 小 的 。 特 别 地 ， 在 最 小 蓝 盖 算法 中 的 第 二 步 ，B 可 以 被 删 卸 。 得 出 矛盾 。 
6.12 下 而 是 证 明 所 期 望 的 纤 果 所 要 用 到 的 阿 姆 斯 特 姑 会 理 和 定理 6.6.8 的 结 尿 。 没 人 、 买 、 
Y 和 Z 是 任意 列 的 集合 。 
1) 包含 律 : 如 果 Y 是 X 的 子 集 ， 那 么 X 一 YT。 
2) 增 广 律 : 如 果 X 一 Y， 那 么 WX 一 WY 。 
3) 传递 律 ， 如 果 XX 一 Y 而 且 Y 一 Z， 那 么 X 一 Z。 
4) 合并 规则 ; 如 果 X 一 了 而 且 X 一 Z， 那 么 XX 一 Y 艺 。 
5) 分 解 律 ， 如 果 X 一 YZ， 那 么 X 一 YY 而且 X 一 Z。 
6) 伪 传 递 律 ， 如 果 X 一 Y 而 且 WY 一 ZZ， 那么 XW 一 Z。 
(a) D—ABCD 
步骤 如 下 : (1) 根据 自 反 律 ， 因 为 D 是 D 的 子 集 ( 都 是 单元 素 集 )，D-*D。(2) 因为 D ， 
ABC (由 FDC3) 给 定 ) 和 D 一 D， 通 过 合并 规则 ， 得 D 一 ABCD。 
6.14 (a) 步 台 1: H={A 一 B,C—B, DA, DA B,D oC, AC 一 了 D] 。 
步 轰 2.， 
1 A 一 B。]=H - {A-=+B}, 在 J 下 区 ': XIEO]=A, X[1] = AA, 多 '=A, 不 包含 B， 所 以 保 
留 A 一 B， 即 H 不 变 。 
2) C— B,J=H - {C—B},， 久 [0]=C, X[1]=C, 所 以 X:=C, 不 包含 B， 所 以 H 不 变 。 
DID+A, J=H- {D—=A}, X[0]=D, Xl1]=DBX, X[2]=DBX, 所 以 X*=DBX， 不 包 
售 态 ， 所 以 H 不 变 。 
4) DB。J-H- {D 一 B}, 区 [0]=D,…, X'*=DABC, 包含 B， 所 以 圳 除 此 FD 。 
新 的 H={A 一 B, CC 一 B, DA, DC, AC—D}。 
DC J=H - {D 一 C}, X+=DAB, 不 包含 DD，、 所 以 H 不 变 。 
结果 H={1A 一 B，C 一 B, D—A, PDC, AC—D}. 
步骤 3， 只 有 AC 一 D 可 能 在 左 侧 可 以 化 简 。 在 其 堪 侧 B 上 循环 : 
1 B=A, Y=C, 本 {4A 一 BC 一 B，D 一 A,D 一 CC 一 D}1，JTY'=CBDA,H 下 Y'=CB， 
不 同 ， 所 以 保持 H 不 变 。 
2) B=C, Y=A,J={A 一 B,C 一 B,D 一 A,D 一 C, A—D}. JFTY'=ABDC, HFY'=AB, 
不 同 ， 所 以 保持 H 不 变 。 
注意 ， 被 提议 《但 是 被 拒绝 ) 的 修改 使 得 太 杀 的 属性 被 包含 在 内 包 中 本 。 
步骤 4，M={TA 一 B, C 一 B, DAC, AC—D}.。 
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6.15 ” 令 Y 代表 H 决 定 下 的 YY ， 那 么 我 们 需要 说 明 Y =Y 暗示 了 H'"= 了 。 在 这 里 ，J=(H -~ 
{Xx 一 A}) UNION {YA}， 而 且 Y=X - {B)。 除 了 一 个 在 左 侧 少 一 个 属性 的 FD 以 外 ，J 和 下 的 


FD 是 相同 的 ， 


这 使 它 蔓 含 了 多 于 它 替 换 的 那个 ， 所 以 显然 芯 是 了 的 子 集 。 我 们 声明 如 果 它 们 


的 确 是 不 同 的 ， 那 么 显然 在 J+ 中 的 YY 一 A 不 在 H" 中 ， 因 为 如 果 Y 一 A 在 H 中 ， 那么 根据 定义 ， 
所 有 的 J 中 的 FD 都 在 HH 中， 以 使 得 H 柳 盖 J， 进 而 覆盖 王 ， 所 以 了 是 下 的 子 集 。 查 是 我 们 已 经 知 
道 H' 是 了 的 一 个 了 和 集 ， 所 以 H'= 本 。 这 与 假设 六 盾 。 

到 目前 为 止 ， 我 们 说 明了 如 果 HH' 和 了 是 不 加 的， 那么 Y 一 A 不 在 H' 中 。 但 是 如 果 Y 一 A 不 在 
H'* 中 ， 那 么 A 不 在 Y 中， 而 且 我 们 知道 Y-*A 在 二 中 ， 即 A 在 Y 中 ， 所 以 集合 YY 和 Y', 是 不 同 
的 。 它 的 道 沁 命题 即 是 我 们 所 要 的 绩 果 。 


6.19 (b) 


6.20 人 bb) 


由 于 对 于 T 没 有 了 阔 数 依赖 ，B -+ A 有 LB 如 ， 所 以 HeadfT 人 记 Head(T2) 并 不 晤 数 
决定 Head(T1) 或 者 Head(T2)。 在 这 种 情况 下 ， 定 理 的 “ 仅 当 ”部 分 可 以 确定 分 
解 不 是 无 损 的 ， 邵 存在 某 些 内 容 ， 有 T<>TI1 wm T2。 我 们 已 经 说 明 过 这 些 内 容 ， 
在 项 要 用 到 (a) 部 分 的 结论 以 前 ， 我 们 首先 独立 十 (的 部 分 进行 讨论 。 从 一 开始 就 直接 
使 用 (a) 的 结论 可 能 可 以 使 整个 过 程 更 简洁 。 从 表 T-A(A, B, C,D, E, FE 人 开始 ， 该 表 的 
主键 是 什么 ?”B 和 PD 不 在 任何 范 数 依赖 的 右 部 ， 所 以 必定 被 包含 在 任意 键 中 。 这 是 由 
于 一 个 键 函 数 决 定 所 有 其 他 列 。 有 了 BBC， 我们 得 到 了 A {通过 (1) 和 (5)) ; E (通过 
(2))】; 又 由 于 有 了 A， 通 过 传递 律 ， 得 到 了 PF (通过 人) ) 于 是 (4 提供 了 G， 而 (9) 提 
供 了 D， 所 以 我 们 得 到 了 《通过 从 左 侧 积 累 ) BC、A、B、FE、G 和 D， 即 所 有 的 列 。 
这 样 ，BC 就 是 T 的 一 个 超 键 ， 又 因为 B 和 C 必 须 被 包含 在 任意 键 中 ， 所 以 BC 是 键 。 
所 有 给 定 的 FD 在 同一 张 表 中 。 

现在 ，D 并 不 函数 依赖 寺 BC， 而 仅 依 赖 于 C， 则 C 一 D 是 一 个 固有 的 键 真 于 集 
FD。 于 是 即使 仅仅 为 了 2NF， 我 们 也 需要 分 解 出 一 张 表 ， 于 是 我 们 有 了 两 张 表 
T=(B, C, A, E, F, GG) 和 T=(C, D}， 相 应 的 刍 为 BC 和 C。T, 包 含 了 除 (5) 和 (1) 外 所 
有 给 定 的 FD， 而 (5) 在 T, 中 ，(1) 跨 两 张 表 。 人 但是， 如 果 我 们 采用 在 (a) 部 分 计算 
的 FD 的 最 小 覆盖 ， 我 们 看 到 只 有 一 个 完全 在 T, 中 ， 一 个 完全 在 T, 中 。 靖 数 依赖 
A 一 FE 和 F 一 G 是 传递 依赖 。 因 此 ，T, 和 了 构成 了 2NF 分 解 。 

(四 对 F={BC 一 AE, A-*FP, FE 一 G,C 一 D} 使 用 算法 6.8.8。 

S= 空 集 。 圣 F 中 的 所 有 ED 进行 循环 ; 

BC 一 AE。S$ 中 什么 也 没有 ， 所 以 没有 尊 数 依赖 可 以 包 合 BCAE， 所 以 把 它 加 入 
到 S$ 中 去 得 8={ {BCAE}}。 

A 一 F。AF 不 包含 在 BCAE 中 ， 所 以 把 它 加 入 到 S 中 去 得 S={{BCAE}, {AF}}。 

F 一 GG。FG 目 前 不 包含 在 任何 集合 中 ， 所 以 把 它 如 人 人 S 得 S={{BCAE}, {AF}， 


{FG}}. 
CD。CD 不 包含 在 日 前 的 任何 集合 中 ， 所 以 把 它 加 入 : S={{BCAE}, {AF}, {FG)， 
{CD}}s 


这 里 ， 唯 一 的 候选 键 是 BC， 它 被 包含 在 BCAE 中 。 所 以 第 二 次 循环 并 没有 问 S 
中 加 入 任何 元 素 。 得 到 的 表 的 设计 结果 和 以 前 得 到 的 结果 是 一 样 的 。 


6.22 ”银行 的 ED 向 题 ， 每 个 账户 有 唯一 的 类 型 、 余 额 和 支行 ， 所 以 我 们 有 acctEia 一 
acct_ type acct_bal pnaon 每 一 个 支行 有 一 个 城市 ， 每 一 个 客户 有 一 个 和 名字， 所 以 集合 为 : 
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ecttid -> acct_ 二 ypPe acct bal bno 
bno -> beilty 
ssn -> ciname cfname cmidinit 


T=(tacctid, acct type, acct bal, bno, bcecity, ssn, clname, 
cfname, cmidinit)。 由 于 ssn 和 各 acctigd 仅 在 FD 的 左 侧 出 现 ， 所 以 它们 必定 被 包含 在 所 
有 和 键 中 ， 而 且 事 实 上 所 有 其 他 属性 都 被 包含 在 {fssn， acctid} 的 闭 包 中 ， 所 以 它 其 实 就 是 T 
的 键 。 现 在 ， 第 一 和 第 三 个 FD 是 键 子 集 依赖 ， 而 第 二 个 FD 是 传递 依赖 ,但 是 由 于 分 解 要 求 的 
范式 是 3NF，。 所 以 我 们 并 不 关心 它们 的 区 别 ， 而 仅 公 进行 三 次 分 解 。 例 如 使 用 如 下 方法 ; 


1, Tl = {acctid, acct type. acct bal, brno, bcity), T? = tacctid, ssn, ciname, 
cfname, cmidinit). 

2. Tl = tacctid, acct_ type, acct_bal, bno}, T2 = (thno, beity)}, 13 = (tacctid, ssn, 
tiname, cftname,. cmidinit}. 

3. Tl = tacctid, acct type, etect_bal, bno}, Te = (bno, beity), T3 = (ssn, clname. 
cfname, cmidinit), Td4 = tacctid, ssn}y Final result, in 3NT form,. 


注意 ， 在 过 程 中 我 们 已 经 从 T 抽 取 了 所 有 的 非 键 属性 ， 而 只 留 下 T,=(acctid， ssn) 作 为 
初始 的 通用 表 的 框架 。 但 是 事实 上 它 代 表 了 该 设计 的 一 个 重要 事实 ; 在 accounts 和 和 
cutomers 之 间 存 在 着 一 个 二 元 联系 。 该 设计 和 习题 6.3 的 第 二 个 设计 是 一 样 的 。 习 题 6.3 的 第 


accounts = tacctid, acct type, acct ball 
branches = {bno, bettyr} 
cusStomers = (ssn, clname, cfrnrame, cmidinity 


has_account .at = (ssSn, acctid, bno) 


我 们 已 经 声明 了 acctid 一 bno， 而 这 意味 着 最 后 一 个 表 有 一 个 键 子 集 依赖 ， 所 以 它 苏 至 
连 2NF 也 不 满足 。 
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IT] (a) ereate table agents taid chart3) not null, 
aname varchart1l3}, city verchart20). 
percent inteyger checktipercent >= 0 and percent <= 10), 


primary key 【td 
create table products (pid chart3) not mul1， 
pname varchar(tl3), city varchart20)., 
quantity integer checktquantity > 0), 
price real checktprice > 0.0)), primary key Cpld); 


7.3 ”大 多 数 内 容 参 见 图 7-2 中 。 对 于 每 行 。 应 该 正好 有 一 个 产品 ， 但 是 对 于 一 个 产品 可 能 
有 多 行 ， 或 者 没有 行 相 对 应 。 所 以 for_prod 和 Products 之 间 的 连接 应 被 标 上 {0, N}， 而 
for_preoa 和 Line_items 之 间 的 连接 应 该 被 标 上 (1, 1)。 

像 在 6.4 节 中 那样 ， 我 们 首先 从 作为 实体 的 表 开 始 ， 然 后 再 加 上 外 键 和 联系 表 来 完成 相关 
的 设计 。 

为 了 简便 ， 开 始 的 实体 表 和 实体 ID 就 使 用 在 图 6-11 中 所 见 的 内 容 : 


customers = (Cei1d} 
orders = tordnoy 
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agents = (Caid} 
iine_items = (ordne, 1ineno) 
products = (pid; 


联系 requests 是 N-1 的 ， 因 此 它 通过 外 键 实 现 : 


orders = tordno, cid} 


类 位 地 ，places 和 has_item 也 是 N-1 的 ， 所 以 orders 为 : 


orders = fordno, cid, aid,. lineno} 


最 后 ，for_prod 也 是 N-1 的 ， 所 以 1ine_items 成 为 ; 
line_items = (ordno,Tineno. pid}: 
treate table customers {cid charta) not null, primary key cid)); 
ereate table orders tordno integer not null, cid Charf3y not null references 


customers, ald chart3} not null references agents, lineno tnteger not nutl 


references line_items, primary key (tordno)y.; 


create table agents faid chart3) not nuli, primary Key 《日 本 
create table products tpid charta)y not null, primary key (pid}); 
create table line ttems (ordno integer references Orders, Tineno integer not mull, 


T7444 (ta) 
(ce) 
7.3 (th) 
{d) 
.6 (a) 
(C) 
7.7 (a) 
(c) 
7.8 (d) 


pid chart3) not null references products,. primary key tordno. lineng}}; 


不 可 能 。 
不 可 能 。 


treate view agerntyiew (Caid, aname, city, percent) 
as spelect aid, aname, city, percent from agents 
where percent >= 0 and percent <~= 10 with check optton: 


create view vproducts as 
select pid, pname, city, quantity from products,; 
grant select, Update teity, quantity) on vproducts to beowulf: 


错 。 根 据 定义 7.1.3 的 主键 子 句 定义 。 

错 。 在 X/Open 中 ，CHECK 子 名 不 允许 包含 子 查询 。 

对 于 所 有 三 种 产品 的 CASCADE 或 缺 省 的 NO ACTION 都 适用 ， 对 于 DB2 UDPB ， 
RESTRICT、CASCADE、SET NULL 和 作为 缺 省 的 NO ACTION 都 适用 。 

Create Table 语 句 会 返回 一 个 错误 ， 这 是 因为 违反 了 主键 约束 (对 于 主键 cid )。 
解决 办 法 是 使 用 Select UNIQUE 子 查询 。 


create table customers] cid not null,. thname, city, 
discnt constraint discnt max checkidiscent <= 15.07), 
Primary Key {cid}) as Select * from customers. 


7.10 (a) 引用 agentords 的 视图 仅仅 在 名 称 上 不 同 于 重 7.2.1 中 的 视图 : 


create view agentords Cordno, month, cid, aid, pid, qty. 


charge, aname, acity, Percent} 
as select ordnoe, month, cid, a.aid, pid, qty. dollars, 
aname, city, percent 
from orders o,. agents a where oO.ald = a.aid: 


根据 图 7-15 中 的 规则 ， 视 图 ag entorqds 在 X/Open 中 是 不 能 更 新 的 (类 似 地 ， 在 SQL-92 
中 也 不 能 更 新 ,但 是 ORACLE 人 允许 在 更 多 的 情况 下 更 新 视图 )。 一 般 情 况 下 ， 对 于 视图 
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agentords 的 行 的 插入 、 更 新 、 人 删除 操作 可 以 被 认为 是 对 于 表 orders 的 行 的 相间 的 操作 。 
这 是 由 于 agentords 中 的 行 和 orders 中 的 行 之 间 有 一 对 一 的 对 应 美 系 。agents 中 的 行 一 般 
对 应 agenteras 中 的 多 行 ， 介 是 对 于 agenks 表 的 更 新 如 果 是 有 意义 的 ， 那 么 允许 进行 该 操 
作 从 道理 上 讲 也 是 说 得 通 的 。 

以 一 个 新 的 aia 播 人。 这 看 上 去 像 是 同时 插 人 了 一 个 新 的 agents 行 和 一 个 新 的 orders 
行 : 一 个 新 的 订单 引用 了 一 个 新 的 代理 。 我 们 允许 这 样 操作 。 当 然 ， 仍 必须 苯 守 所 有 的 已 存 
在 的 完整 性 约束 。 俩 如 ,订单 必 须 引 用 一 个 已 经 存在 的 产品 pid，or9no 不 能 和 已 经 存在 的 
ordno 重 复 等 。 

以 一 个 已 经 存在 的 aid 插 人 。 这 就 是 搬入 一 个 新 的 引用 了 已 经 存在 的 aid 的 订单 。 可 能 出 
错 的 情况 是 : 播 人 操作 指定 了 一 个 已 有 的 aia， 但 是 给 了 一 个 错误 的 agents 其 他 列 的 值 ， 例 
如 aname。 由 于 aid 被 认为 是 代理 商 的 主键 ，aid 痛 数 决 定 上 所 有 其 他 列 ， 而 给 定 一 个 其 他 的 
aname 值 会 破坏 完整 性 约束 ， 于 是 插入 操作 会 失败 。 在 插 人 时 允许 不 指定 agents 的 依赖 列 而 
使 用 晴 数 依赖 的 值 作为 缺 省 值 是 比较 合理 的 。 

上 机 作业 

7.14 ORACLE 的 情况 : 


SDL select * from user_ constraints: 
， many Tines of vutput 
SOL> alter table customers add constraint discntmax check discnt c= 12.0): 
ERROR at line 1: 
ORA- O2293: cannot enablie ... check constraint violated 
SOL> update customers Set disent = 10.0 where cid = 'cO01’; 
1 row Updated, 
S0LY alter table customers add constraitnt discntmax check disent <e 12.0): 
Tabile altered. 
SOL> update customers Set discnt 一 16.0 where cid = 'cO01'; 
ORA-02290: check constraint ... violated 


SQL> select * from Sustomers: 

.S588 discnt = 30.0 for codl. 

$0L> alter table drop constrafnt discntmax: 

Table altered. 

sgL> update customers set disent = 16.0 Where cid = ‘coO0l': 
1 row updated. 

SOLY select * from Customers: 

- .SB disernt = 15.0 for 有 六] 

SOL> exit 

Now run loadcap as explained in Appendix 只， 


7.15 (a) ORACLE 的 情况 


SOL> insert into orders values C1031, "jul’, ‘cool’. "a0l', pOl", 1000, 450.0):; 
1 row inserted. 


SOL> create view returns fordno, month, cid, aid, pid, qty, dollars, 
2 discnt, percent, price) 

3 as selaect ordne, month, o.cid, o.31d, 0.pld, dty. dollars, 

4 discnt, percent, price 

8 from orders 日 。 customers cc, ayents a. products p 

6 Where cceid = tcid and a-aid = 0.&igd and p.Pid = vo.pid; 


SOLY select view_ name from User_views,: 
Yiew name 


-ai---- 
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下 关外 册 户 放 六 
SOLS select column_ name from user_ tab_ columns where table_name = "RETURNS':; 


colamn_name 


dTY 


DOLLARS 


DISCNT 


PERCENT 


PR 世上 


(c) 


select ordno. qty. dollars, discnt, percent,. price, 


diy * price = Cdiscnt f 100) * price * qty from returns: 


7.20 为 了 查找 表 Ppecp1le 所 使 用 的 行 类 型 (作为 列 的 数据 类 型 )， 需 要 进行 如 下 的 三 元 连 


接 ; 
select typ.name from syscolumns 区 。 systables t, sysxtdtypes typ 
where t.tabid » ctabid and t.tabname = ‘peoptle' 
and c.,extended id = typ.extended_1td; 
S31Ect typ.hname from syscolumrns Cc, systables +, SySsattrtyps a, Sysxtdtypes typ 
where t,tabid = Cc,tabid and t.tabname = ‘people’ 
afd c.extended id = a .extended_id 
and a.xtd type 1d = typ.extended _ 1d: 
第 8 章 习 题解 答 
8.1 fay 外 于 最 小 区 域 tminextents) 是 3， 所 以 3x20 480=61 440 字 节 。 
(b) 由 于 最 大 区 域 !tmaxextents) 是 8， 所 以 8 x20 480=~163 840 字 节 。 
8.2 (a) 在 -一 个 页 面 中 有 2048 个 字 节 ， 对 于 512 个 酸 行 日 录 需 要 $12 x 2=1024 个 字 节 ,村 
是 剩 下 2048 - 1024=1024 个 字 节 用 于 存放 行 ， 于 是 对 于 每 行 有 1024/512=2 个 字 
(c) 我 们 人 允许 : 2”=8 388 608 页 面 / 表 。 
8.4 (a) 每 行 希 要 大 约 100 字 节 (和 包 搬 两 个 字 节 的 目录 偏 移 )， 且 我 们 每 肌 有 大 约 0.75 x 


(d) 


2000=1500 个 可 用 字 节 。 那 么 1500 字 节 / 页 / 100 字 节 / 行 = 15 行 /页 。200 000 行 / 
15 行 /页 =13 334 页 。 

仍然 需要 对 索引 的 要 进行 一 次 磁盘 访问 ， 并 对 下 一 级 目录 进行 一 次 磁盘 访问 。 
我 们 要 在 10 000 个 叶子 层 项 中 进行 搜索 ， 在 148 项 /页 的 情况 下 ， 这 意味 着 对 叶 
节点 页 面 有 大 约 CELLIIO 0001148)=68 次 访问 。 由 于 行 并 没有 被 耿 筷 ， 而 日 假设 
缓冲 机 制 被 和 忽略， 获取 10 000 行 需要 10 000 次 磁盘 IO。 所 以 磁盘 IO 次 数 为 
(1+1+68+10 000)=10 070 次 磁盘 访问 。 在 每 秒 40 次 磁盘 访问 的 情况 下 ， 我 们 需 
要 天 约 252 秒 。 在 每 秒 80 次 IO 的 情况 下 ， 我 们 仅 需 要 126 秒 。 

为 了 计算 行 的 数目 ， 查 询 优 化 器 仅 需 要 计算 入 口 的 数 日 ， 而 不 需要 更 深入 地 去 
取 每 一 行 。 于 是 ， 人 磁盘 访问 次 数 为 (L+1+68)=70 次 。 在 每 秒 40 次 LO 的 情况 下 ， 
这 需要 1.75 秘 ， 
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8.6 (a) 中 对 DB2 UDB 是 错 的 (但 是 DB2 UDB v6 允许 32K 字 节 的 页 面 )。 
(iii) 对 。 人 参见 例 8.3.2。 
(VY) 对 。 在 1 000 000 个 页 面 中 有 1000 个 页 面 在 缓冲 区 中 ， 所 以 1000 个 页 面 中 有 1 
个 页 面 存 在 于 缓冲 区 中 。 
8.7 (b) 2000 的 75 多 是 1500， 所 以 页 面 中 有 1500 字 节 可 用 。---: 项 包含 : rowiq 6 子 闻 ; 
keyval 在 此 为 ?7 字 节 ， 另 有 1 字 节 的 额外 开销 ， 总 共 14 个 字 节 。 于 是 
1500/14=107 项 /页 ，400 000 项 1(107 项 /页 )=3739 个 叶子 层 页 面 。 
一 个 聚 乒 索引 使 用 同样 多 的 索引 页 面 ， 但 是 20 000 个 数据 行 在 磁盘 上 是 邻近 的 ， 
它们 存在 于 20 000/8=2500 个 页 商 中 。 于 是 共 要 2689 次 磁盘 页 LO。 
8.9 {a) 在 此 N=128，M=10 000。E(S)=10,000*(1 -0.9999””) ， 其 中 0.9999”-0.9999 
0.99997 .=0.9873， 则 EC(S)=10 000 x 0.0127=127。 
使 用 [8.6.4]，10 000 x (1 一 exp( ~ 128/10 000))=10 000(1 - 0.9873)=127。 
是 的 ， 两 种 方法 都 表明 期 望 的 冲突 次 数 为 一 次 。 
8.10 {a) 所 有 站 镖 在 不 同 的 槽 中 的 概率 对 于 2 支 飞镖 为 3641365， 这 是 因为 第 一 支 飞 镖 可 
以 到 任何 槽 中 , 而 第 二 支 飞 镖 必须 在 365 个 槽 中 犁 下 的 364 槽 中; 而 对 于 3 支 飞镖 ， 
概率 为 (3641365) x {3631355); 对 于 所 期 望 的 N 支 飞镖 ， 概 率 为 (364 x 363 x …x 
365 — N+1)N365" :=0.5.。 (1 -365H1 -21365) (1 一 (N=1Y365)=0.5。 展 开 乘 法 ， 
并 扳 略 在 分 母 中 重复 出 现 的 因子 365， 约 为 1 - (1+2+3+-…+(N -1))/365=0.5 或 
1+2+…+(N - 1)=365/2。 其 中 的 和 为 (N - 1)Y2， 所 以 (N ~- 1)=365， 即 近似 得 
N=20。 仔 岗地 计算 得 N=23 时 得 到 的 结果 0.493 最 接近 于 0.5， 所 以 忽略 的 项 对 结 
果 仍 有 一 些 影 啊 。 
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9.1 (al 寻 道 时 间 0.008 秒 + 旋转 延 时 0.004 秘 + 传输 时 间 0.004 秒 (8 匀 以 0.0005 ) =0.016 秒 。 
(ce) 在 这 种 情况 下 ， 每 次 顺序 预 取 8 页 是 有 帮助 的 。 为 了 将 5000 个 索引 页 面 读 取 到 
P38 块 中 ， 计 算得 5000/8=625 块 ， 所 以 大 约 需 要 625 x 0.016 秒 ( 即 大 约 10 秒 )。 
( 在 此 没有 经 验 规则 ， 就 和 我 们 所 说 的 以 每 秘 800 次 IO 的 速率 处 理 顺 序 预 取 的 
情 沈 一 样 ， 计 算 时 党 要 格外 小 心 。) 我 们 还 有 50 000 个 聚 艇 数据 页 面 ， 且 50 
000/8=6250，6250 x 0.016=100 秒 。 所 以 总 共 执 行 时 同 为 10+100=110 秒 。 
(ii 在 这 种 情况 下 ， 和 使 用 了 随机 VO ，50 000R+5000R 需 要 55 000/80 种 ， 即 687.5 秒 。 
9.2 (a) PCTFREE=0 时 ， 我 们 可 以 把 每 10 个 长 为 400 字 节 的 行 放 人 4KB 的 磁盘 页 面 中 去 。 
于 是 ，100 000 行 就 需要 100 000110=10,000 个 磁盘 页 面 。eidx 索 引 有 10 字 节 的 项 ， 
在 一 个 叶子 页 面 可 以 放 400 个 项 。 于 是 ，100 000 个 时 子 层 项 需要 100 
000/400=250 个 时 子 页 耐 。 在 上 一 层 ， 项 的 数目 是 相同 的 ， 每 页 400 项 ， 显 然 250 
项 可 以 放 人 一 个 页 面 中 ， 即 根 。 
(by P(eaf)=1/250, 
(ii) (1 - P(leaf))=249/250.。 
(iii) 调用 事件 NOT-leaf-N。 我 们 需要 N 个 独立 事件 的 连接 ， 其 中 每 个 事件 的 概率 
为 2491250。P(NOT-leaf_-N)=(249.250)"(N 次 释 )。 
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(iv (2401250) ”=0.367。( 有 趣 的 是 ， 这 是 exp{ - 1) 即 0.368 的 一 个 近似 值 ， 这 是 
由 于 计算 所 用 的 公式 为 (1-1/x*， 对 于 一 个 很 大 的 x， 当 x 趋向 于 无 穷 大 时 ， 
该 式 子 趋向 于 exp( ~ 1).) 

(wm 有 0.367 部 分 会 在 缓冲 区 外 ， 这 是 因为 它们 在 最 后 125 秒 中 没有 被 引用 ， 所 以 
保留 在 缓冲 区 中 的 数 日 为 (1 -0.367) x 250=158.25。( 你 可 以 根据 “期 望 ”的 
定 广 重新 计算 。 对 于 某 一 个 特定 的 叶子 ，P( 叶 子 在 缓冲 区 中 )=1- 
0.367=0.633。 在 缓冲 区 中 的 叶 的 期 望 的 值 = 叶 数 目 x 0.633=158.25。) 

oi) 在 此 我 们 有 N=250 个 飞 任 和 M=250 个 空位 ， 所 以 空位 命中 率 的 期 望 约 为 
E(S)=MI(1 - ew=250(1 ~ e')=158, 

(iv 从 (b) 部 分 中 我 们 看 到 在 长 为 125 秒 的 时 间 段 内 引用 的 250 个 数据 页 面 中 有 赵 
过 247 页 最 终 在 缓冲 区 中 。 于 是 ， 忽 略 两 次 重复 引用 ， 仅 有 三 次 引用 命中 已 
经 引用 过 的 页 面 ， 所 以 仅 有 三 页 被 重复 引用 。 另 一 方面 ， 在 这 段 时 间 内 引用 
的 250 个 索引 页 面 中 仪 有 158 页 最 终 在 缓冲 区 中 ， 所 以 250 - 158=92 个 索引 叶 
子 页 面 被 重复 引用 。 由 于 叶子 页 面 比 数据 页 面 少 ， 所 以 它们 被 重新 引用 得 更 
频繁 。 于 是 在 这 段 时 间 内 更 少 的 不 同 的 索引 叶子 页 面 被 引用 ，, 且 它们 都 在 组 
冲 区 中 。 

在 此 我 们 每 秒 有 两 个 查询 。 不 在 缓冲 区 中 的 数据 页 面 的 比例 为 (10 000 - 

247)110 000 =0 .975。 所 以 VO 代价 为 2 x 0.975， 即 为 1.950。 根 页 面 从 不 会 在 绥 

冲 区 以 外 。 一 个 叶子 上 页面 有 0.367 的 概率 不 在 缓冲 区 中 ( 根据 (pb) )， 所 以 对 于 两 

个 查询 都 增加 了 WO 开销 0.734。 于 是 ， 总 的 WO 开销 为 每 秒 1.950+0.734=2.684。 

对 于 数据 页 面 ，LWO 代 价 将 为 2， 显 然 这 是 一 个 比 LRU 更 高 级 的 策略 。 这 是 因为 

我 们 使 用 了 更 小 的 内 存 和 更 低 的 WO 代价 。 

(DACCESSTYPE = I, ACCESSNAME = C1234X, MATCHCOLS = 1, 
(INDEXONLY = N)。 

(in 必须 检索 所 有 C1 值 从 1 到 10 的 索引 项 。 这 是 C1234X 整 个 范围 的 1/10， 
Cl1234X 的 NLEAF=150 151， 所 以 需要 获取 的 叶子 页 面 数目 为 15 015。 使 用 
顺序 预 取 ， 所 以 需要 财 间 为 15 015/800=18.8 种 。 

(iii) 该 复合 谓词 的 过 滤 因 子 为 (1710)(1/20}(1150)=1/10 000。 

(iv 检索 的 行 的 数目 为 (UV10 000)(100 000 000)=10 000。T 中 的 行 在 索引 C1234X 中 
都 是 连续 的 。 在 此 选择 了 Ci 的 10 个 值 ， 每 一 个 又 被 分 为 C2 信 的 200 个 范围 。 从 
中 我 们 选取 10 个 邻接 的 区 域 。 但 是 这 10 个 的 每 一 个 又 被 进一步 分 为 不 同 C3 值 
的 50 个 范围 ， 从 中 我 们 选取 一 个 。 这 样 ， 就 使 用 了 索引 中 分 离 的 100 个 区 域 ， 
面 将 它们 分 离开 的 区 域 并 没有 被 使 用 。10 000 行 分 布 在 100 个 区 域 中 ， 所 以 在 
一 个 区 域 中 大 约 有 100 个 行 是 连续 的 ， 但 蚌 整 个 集合 中 的 行 并 不 是 相互 连续 的 。 
面 DB2 并 不 能 利用 这 些小 的 连续 的 区 域 , 因为 它 将 在 处 理 筛 选 谓词 时 处 理 它 们 。 
( 列表 预 取 也 不 会 被 使 用 ， 因为 没有 过 滤 可 沁 对 RID 列 表 进 行 操作 。) 所 以 执行 
时 间 为 10 000/80=125 种 。 

(Vv) 15 015S+10 000R， 执 行 时 间 为 18.8+125=143.8 秒 。 

(CI 和 C2 是 匹配 列 。 匹 配 在 C2 停 上 ,这 是 根据 定义 9.5.4 的 第 3 部 分 得 出 的 结论 。 
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(ii 没有 匹配 的 列 ， 这 是 因为 C1<>6 不 是 一 个 可 索引 的 谓词 。 
(JRC1 和 C2 是 匹配 列 。 在 C3 前 殉 配 停止 ， 因 为 C3 1ike'%abc' 不 是 可 索引 的 。 
(Yii) 没有 匹配 的 列 ， 这 是 因为 C1=Expression 不 是 可 索引 的 。 
(b} YFF(CC1=7)=1/100=0.01，FF(C2>=101)=100/200=0.5， 所 以 合成 的 FF=0.01 x 
0.5=0.005。 
(iii) 0.005 x 100 000 000=500 000 个 索引 项 。 请 广 意 所 有 的 列 长 度 都 为 4 个 字 节 。 
对 于 C1234X， 键 值 长 度 为 16 字 节 。 在 叶子 层 有 大 量 的 庄 缩 ， 每 个 重复 块 有 1 
个 键 值 ( 16 字 节 )、4 个 字 节 的 块 偶 移 以 及 10 个 长 度 为 4 个 字 节 的 RID。 这 意 
味 着 10 个 项 共 60 字 节 ,， 或 者 说 每 项 6 字 节 。 我 们 可 以 在 每 个 页 面 中 存放 
FLOOR(4000/6)=666 项 。 这 样 就 有 CEIL(G500 0001666)=751 个 页 面 存 在 于 叶 
子 层 。 它 们 可 以 被 顺序 预 取 (Ss }。 在 叶子 层 以 上 ， 索 引 还 有 一 层 ， 但 是 其 中 
只 有 一 页 在 第 一 次 访问 的 查找 中 被 访问 。 该 页 面 要 求 随机 访问 (R )。 
(v)1 351S46000R=751/18004+6000/180=75.95 秒 。 

96 (a) 在 此 ， 我 们 有 五 千 方 行 HFF(incomeclass=10)=1110， 所 以 从 incomex 取 得 的 
RD 列表 将 包含 五 百 万 个 RD。 这 低 于 绝对 最 大 值 一 于 六 百 万 。 五 百 万 个 RID 和 党 要 两 
于 万 个 字 节 ， 这 一 定 小 于 RHID 池 的 350 将， 所 以 RID 池 至 少 有 更 千 方 个 字 节 ， 由 于 RID 
池 是 缓冲 池 的 一 半 ,， 这 意味 着 缓冲 池 至 少 需要 八 和 于 万 字 节 。 这 样 ， 系 统 必 须 有 足 铝 
的 内 存 来 容纳 一 亿 二 千 万 字 节 的 缓冲 池 和 RID 池 。 

(c) FF(AGR between 20 and 39)=215， 将 有 0.4 xs 于 万 =2 千 万 agex 索 引 项 ， 
超出 了 RID 列 表 的 绝对 最 大 值 ， 所 以 不 可 能 。 
(e) 根据 定义 9.6.1 的 规 由 3， 这 不 可 能 ， 因 为 排除 了 IN_ELIST 谓 词 。 

9.7 (a ACCESSTYPE=I，ACCESSNAME=mai1lx、MAICHCOLS=1。 我 们 停止 从 左 
到 右 在 zipcode 部 分 匹配 的 原因 有 两 个 : (ljmai1Lx 中 下 一 列 为 hobby， 它 并 不 
匹配 ，{2) 当 我 们 过 到 BETWEEN 请 词 时 总 是 停止 匹配 ，。 

(c) 全 是 的 ， 在 习题 9.6 的 (a) 所 要 求 的 内 存 条 件 下 ， 我 们 可 以 在 incomeclass=10 
中 利用 inceomex 索 引 使 用 步骤 MX。 
(ii) 


TYPE COLS NAME FETCH | SEQ 
0 
ly Ts 
WN 到 汪汪 

加 









1 | meomex 
0 


注意 ， 谓 词 按照 过 滤 因 子 从 小 到 大 的 顺序 排列 ， 一 旦 可 能 就 进行 相交 操作 ， 以 
避免 在 假想 的 栈 中 存在 超过 一 个 的 RID 列 表 。 其 他 顺序 也 是 可 用 的 。 
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(ii} 1/50 000。 
像 在 td) 中 那样 ， 从 扫描 mai1lx 索 引 开 始 为 zipcode 谢 词 抽取 RID 列 表 表 要 3.12 
秒 。 然 后 从 NLEAEF=50 000 的 agex 为 age 谓词 抽取 RID 列 表 ， 于 是 有 (17S01(0S0 
0001，LO 代 价 为 1000S， 需 要 时 间 为 1000/800=1.25 秒 。 最 后 从 NLEAF=50 000 
的 incomexXx 中 为 income 谓 词 抽取 RID 列 表 ， 于 是 有 (1710)(50 000)，ILO 代 价 为 
5000S， 需 要 时 间 为 6.25 秒 。 最 后 在 1000 各 数据 页 面 上 有 1000 个 数据 行 ， 但 是 此 
时 我 们 可 以 使 用 列表 预 取 1000L， 需要 时 间 为 1000/200=5 秒 。 总 共 需 要 时 间 为 
3.12+1.25+6.25+5=15.62 秘 。 只 有 在 偶然 情况 下 它们 才 会 同时 发 生 。 
不 可 能 。 它 将 有 25 000 000 个 RD， 于 是 超过 了 绝对 最 大 值 。 
(i) zipcode between 02139 and 07138 是 匹配 谓词 ， 其 余部 分 是 得 
选 谓词 。 
(ii 对 于 和 任何 一 种 方法 ， 我 们 希望 FF x 50 000 000=0.01 x 0.02 x 0.05 x 50 000 
000=500 行 ， 且 并 不 语 簇 。 对 于 方法 (i)，RID 在 筛选 时 被 找到 ， 于 是 必须 使 
用 随机 WO, 需要 500R=500/80=6.25 秒 。 对 于 方法 (i 我 们 获得 了 了 RID 列表 ， 
于 是 可 以 使 用 列表 预 取 ， 需 要 500L=500/200=2.5 种 。 
仅 有 的 匹配 列 为 zipcode， 这 是 因为 根据 定义 9.5.4 的 第 3 部 分 ， 搜 索 匹 配 谓词 
的 操作 在 磁 到 BETWEEN 谓 词 后 停 上 上。 为 zipcoede 的 BETWEEN 谓词 所 进行 的 
索引 IO 将 扫描 (2000/100 000}(250 000 叶 子 页 面 }=5000 叶 子 页 面 ， 使 用 顺序 预 取 
5000S 需 要 执行 时 间 为 5000/800=6.25 秒 。 和 和 所 有 请 词 相 结合 的 过 滤 因 子 (包括 往 
选 谓词 按照 谓词 子 句 的 出 现 顺序 得 : (2000/100 000) (1750+1750 - (1150)(1/50)) 
(17100) C1710) = (1750) (1725) (1100) (1710) = LU1 250 000。 在 brospects 中 有 
50 000 000 行 ， 这 意味 着 我 们 期 望 抽取 (71 250 000)(50 000 000)=40 行 。 使 用 随 
机 WO (我 们 不 可 以 使 用 列表 预 取 ， 这 是 因为 由 于 我 们 使 用 了 筛选 谓词 ， 我 们 并 
没有 抽取 RID 列 表 )，40R 的 执行 时 间 为 40180=0.5 秒 。 总 的 执行 时 间 为 6.75 秒 。 
a) 花费 6.75 秒 ， 优 于 (中) 的 11.37 秒 。 这 条 普遍 的 规律 之 所 以 成 立 是 因为 在 使 用 
了 筛选 谓词 的 条 件 下 ， 对 于 第 一 列 的 匹配 扫描 和 在 MX 抽取 时 和 其 他 索引 扫描 
一 起 进行 的 打 描 是 重复 的 ， 所 以 MX 抽取 时 花费 了 更 多 的 索引 LO 。MX 的 该 项 
亏损 在 最 后 可 能 被 弥补 ， 因 为 MX 方法 在 抽取 数据 页 面 时 允许 列表 预 取 。 
考虑 Ti.C6=S， 我 们 限制 T1 的 1 000 000 行 到 1720， 即 50 000 行 。 对 于 T1.C7 中 的 
每 个 值 ， 我 们 希望 匹配 T2.C8 的 值 ， 在 Ti 中 选取 的 50 000 行 中 ，TI.C7 有 一 个 常 
数值 K。 我 们 问 在 T2 中 有 和 多少 行 与 之 匹配 ， 踊 T2.C8=K 的 选择 性 为 多 少 ? 显然 ， 
管 案 为 11200 000， 有 5 行 《平均 ) 匹配 。 所 以 ，T1 的 50 000 行 中 的 每 :一行 匹 配 
T2 中 的 5 行 ， 而 且 记 今 为 止 在 连接 中 有 250 000 行 。 现 在 ,我 们 必须 限制 
T2.C9=6， 其 筛选 因子 为 11400， 连 接 的 结果 中 行 数目 为 {1/400)({250 000)=625。 
第 一 遍 以 后 : 
12 .45 67 8417 29 58 76122 39 81 91128336596|413547711 3241 59 
第 二 遍 以 后 : 
71229455867768412228333965819196114133241545977 
第 三 遍 以 后 : 
7 12 22 28 29 33 39 45 58 65 67 76 81 %4 91 9611413 324] 54 5977 
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第 四 凋 以 后 : 
147 121322 282903233394]1 .43554 5358 506307 76 77 81 $8491 90 


注意 在 以 下 部 分 ， 我 们 使 用 以 前 的 磁 副 束 度 S=1/400，L=1/100，R=1/40 秒 。 


9.12 {a) 
(Cc) 


(e) 


(g) 


9.13 (a) 


‘b) 


{172)(1710)1 000 000)=50 000。 

对 于 KL00>8D，1/45;， 对 于 K10K betweern 2000 and 3000，1000710 
000=1/110; 对 于 K5=3，1/15; 所 以 (1715)Jf(17101(175)01 000 000)=(17250) 
(1 000 000)=4000 。 

如 同 在 正文 中 介绍 的 那样 ， 在 XK4 的 情况 下 可 以 进行 志 空 间 扫 描 ， 且 1737 次 预 取 
HO 提供 了 1737 x 32=55 584 页 。 注 意 BENCH 表 有 55 556 页 ， 所 以 非常 接近 。 我 
们 的 经 验 规 则 意味 着 55 5848 将 花费 55 584/400=138.96 秒 。 事 实 上 ， 我 们 看 到 
花费 了 133.27 秘 ， 所 以 讯 速 度 比 计算 的 稍 抉 。 注 意 ， 在 开始 计 IiQ 时 间 前 ， 
26.90 秒 的 CPU 时 间 并 没有 从 133.27 秒 中 减 去 : /10 和 和 CPU 十 重合 的 ， 所 以 所 有 
的 执行 时 间 中 都 有 LO 操作 在 进行 。 

如 同 在 习题 9.4(a) 中 那样 ， 我们 使 用 嵌 套 循环 连接 作为 计算 的 基础 。 通 过 
Bl1.K100=99 限 制 B1， 所 以 检索 了 10 000 行 。 对 于 其 中 的 每 -… 行 ，B1 .250K 
是 一 个 常数 K。 我 们 问 B2 中 有 多 少 行 满足 B2 .500K=K? 平均 为 2。 这样 ， 现 在 
我 们 在 连接 中 有 20 000 行 。 现 在 用 B2 .K25-193 进 行 限 制 ，FEF 为 11725， 且 
(1/25)(20 000)=800。 实 际 上 检索 到 的 行 的 数目 《附录 D ) 为 804。 

Bl .K100=22 选 择 了 Bl 中 的 10 000 行 。 对 于 其 中 的 每 一 行 ，B1 .K250K 是 一 个 
1 到 250K 之 间 的 常数 ， 所 以 如 果 该 常数 大于 100K， 则 B1 .Kk250FK=B2 .Kl100K 
不 选择 性 何 内 容 ， 否 则 从 B2 中 选择 10 行 。 后 者 的 发 生 可 能 为 该 时 间 的 40%。10 
行 中 仅 有 1/25 平 均 行 好 0.4 被 B2 . K25=19 选 择 。 这 样 ， 在 连接 中 的 期 望 值 为 90.4 
x 0.4x10000=1600 行 。 

B81 是 外 表 : 在 此 ，10 000 个 值 一 一 K100 索 引 的 22 索 引 项 被 壮 取 到 RID 麟 表 中 ， 
允许 对 B1 的 10 000 行 进行 列表 预 取 需 要 决定 Bl ,K100K 和 B1 .KSEQ， 该 数据 多 
面 访问 的 1O 代 价 为 10 000L。 索 引 项 表示 了 K100 索 引 的 1 ， 或 (使 用 图 9-28)， 
1051 页 中 的 1 名 ， 即 大 约 11 页 。 它 们 可 以 使 用 顺序 预 取 ，IO 代 价 为 118。 于 是 对 
于 10 000 行 中 的 每 一 行 ， 内 循环 中 或 者 使 用 列表 预 取 访 问 B2 的 10 行 (40 名 的 可 
能 ) 或 者 访问 0 行 (60 多 的 可 能 )。 这 由 B1.K250K 是 否 小 于 100 000 决 定 。10 行 
被 检索 出 来 以 后 又 被 谓词 B2 .K25-=19 过 滤 ， 得 到 在 连接 中 的 0.4 行 。 但 是 这 仅 
在 10 000 次 的 40 有 中 发 生 ， 即 4000 次 ， 所 以 IO 代价 为 4000 x 10L=40 000L。 于 
是 ， 总 的 IO 代价 为 10S+50 000L=50 0001100=500 秒 。 

B2 是 外 表 : 在 此 ，40 000 个 值 一 Fk25 索 引 的 19 索 引 项 被 读 取 到 RID 列 表 中 。 
允许 对 B2 的 40 000 行 进行 列表 预 取 需要 决定 52 .K100K 和 B2 .KSEQ， 该 数据 
页 面 访问 的 MO 代价 为 40 000L。 所 有 的 索引 项 都 是 相同 的 ， 所 以 它们 每 个 占用 
4 字 节 ， 共 160 000 字 和 节 ， 即 40 页 ， 通 过 顺序 预 取 的 MO 代价 为 408。 热 后 对 于 
40 000 行 中 的 每 一 行 ， 内 循环 通过 匹配 B1 .K250K=B2 .K100K 访 问 B1 中 大 约 
4 行 ( 所 有 情况 下 都 是 如 此 ,这 是 因为 B2 .K100K 的 值 总 是 在 K250K 的 范围 之 内 六 
匹配 还 涉及 到 一 个 使 用 K100K 索 引 、 每 行 IO 代价 为 IR《 总 共和 代价 为 40 000R ) 
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的 查找 过 程 。 4 行 对 于 列表 预 取 似乎 太 小 了 点 , 但 是 我 们 仍然 允许 进行 列表 预 取 ， 
所 以 我 们 计算 为 40 000 x 40L=160 000L。 这 些 行进 一 步 被 谓词 B1 .K100=22 筛 
选 。 总 的 WO 代价 为 405+200 000L+40 000R=3000 秒 。 
9.15 {a} select npages from systables where name = ‘BENCH’ ，; 
( 参见 图 9-13 ) 
(c) K2X 索 引 几 平 完全 一 样 ， 所 以 有 4 字 节 /项 ， 即 大 约 1000 项 /页 。 在 叶子 层 有 
1 000 000 项 ， 因 此 是 1000 页 。 


第 10 章 习题 解答 


10.1 (al 在 120ms (2 个 VO 和 2 个 CPU 块 ) ( 即 50TPS ) 中 有 六 个 事务 。 


Riatx) 





10.2 (al T2 一 工 3 一 工 | 


10.3 RA) WIA) RotA) RB} C2 RiIB) WilB) Cl 
操作 2 和 3 纵 出 了 T, 一 T,， 而 操作 4 和 6 纵 出 了 TT,。 前 趋 图 为 : 

ar 

Ti Tz 

Te- 


为 了 问答 问题 的 第 二 部 分 ， 人 很 设 A 和 B 是 一 般 只 能 看 到 存款 的 账户 ， 而 T, 的 任务 是 保证 账 
户 A 不 超过 100 一 一 如 果 A 超 过 了 100， 那么 T, 的 任务 就 是 把 A 的 值 降 到 50， 并 移 走 超额 的 部 分 
到 账户 B。 我 们 根 设 工 的 任务 是 检查 账户 A 和 吾 的 总 额 ， 如 果 总 额 超过 200， 就 将 A 和 B 的 总 萄 
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减 到 150， 并 将 超额 部 分 移 到 第 三 方 余 额 ，C。 现 在 假设 开始 时 A=120，B=140。 由 于 T, 并 没有 
改变 A 和 和 B 的 总 额 ， 我 们 可 以 看 到 任何 一 种 申 行 化 执行 中 T, 都 将 从 A 和 B 中 减 去 部 分 加 到 C 中 。 
但 是 ， 我 们 真正 看 到 的 是 : 
RA, 120) W (A, 50) RA, 50) R2(B, 140) C, RB, 140) W,(B, 210) C, 
我 们 注意 到 T, 看 到 A+B 至 多 为 50+140=190。 由 丁 该 值 小 于 200，T, 不 执行 任何 动作 。 在 任 
何 一 种 串 行 调度 中 ， 这 种 情况 都 不 会 出 现 。 
10.5 ”这 是 一 个 “ 脏 写 ”的 例子 。 在 此 ， 每 一 个 事务 回 写 新 的 A 值 都 没 能 考虑 到 其 他 事务 
的 更 新 操作 。 锁 调度 器 将 它们 柄 译 为 如 下 事件 序列 ; 
RL(A) Ri(A) RL,(A) RA(A) WLCA) (和 前 面 的 RL(A) 剖 突 一 一 T 必 须 等 符 WL,(A) (种 前 面 
的 RL(A) 冲 罕 一 一 在 等 荷 图 中 循环 一 一 选择 T: 作 为 牺牲 者 ) A，(WL(A) 现 在 成 功 了 ) Wi(A) C 
(T: 现 在 以 事务 T, 的 形式 重 做 ) RLXA) R(A) WL(A) WA)C， 
我 们 看 到 T, 和 T,( 被 重 命名 为 T, ) 的 操作 以 串 行 的 顺序 发 生 。 
10.6 (a) WL(A) WAA) RL(A) 5 和 前 面 的 WLCA) 证 突 一 下 必须 等 竺 也) RL,(B) R,(B) WL:(Y) 
WiY) WL:xB) {和 前 面 的 RL(B) 冲 突 一 一 T, 必 须 等 待 T,) C, (释放 对 了 的 锁 ， 所 以 
WLAB) 就 成 功 了 ) WAB) C, (释放 对 A 的 锁 ， 所 以 RLCA) 成 功 了 RAA) WLAD) WD OQ, 











Wath) RMA) WIZ) RolB) WY) WIB) CC:O, 
操作 号 1 2 3 4 5 6 
注意 ， 从 操作 1 和 2 中 可 以 看 到 在 等 待 图 中 T, 一 T:.。 接 着 从 4 和 6 中 可 以 得 到 T 一 


T:。 此 外 没有 其 他 操作 对 是 对 相同 的 元 素 进行 处 理 的 。 所 以 没有 其 他 的 冲突 对 ， 
且 等 待 图 中 没有 环 ， 于 是 不 存在 死 锁 。 在 操作 6 以 后 的 等 待 图 为 : 


工 一 虐 .一 下， 
10.7 (a) RE, 8)。 这 是 因为 在 此 之 前 有 AA、B、C、D 的 页 面 都 已 经 被 访问 过 并 填 满 了 组 
冲 区 中 的 四 个 页 面 。 


(c) 有 数据 项 A 的 页 面 将 被 LRU 模 式 丢 弃 。 这 是 因为 它 具有 最 长 的 引用 间隔 。 
(e) 不 会 ， 它 仅仅 强制 写 出 该 事物 的 日 志 数 据 。 而 真正 的 胜 的 页 面 可 能 继续 存在 于 
缓冲 区 中 ， 直 到 某 个 合适 的 时 间 才 被 写 出 。 
10.8 (a) () 下 面 是 作为 该 经 历 的 结果 被 写 的 一 系列 日 志 项 ; 


(ii 最 后 的 写 操作 将 不 写 到 日 志文 件 中 ， 这 是 由 子 没有 Commit 强 制 写 它 。 现 在 我 


们 上 略 述 恢复 时 所 进行 的 动作 。 
Rollback 
i. (C, 2) 将 T2 作 为 已 经 提交 的 事务 放 人 活动 列表 。 
2.(W, 2, E, 8, 9) 无 动作 。 
3, (5§, 4) 无 动作 。 
4. (CKPT LIST = T1, T2, T3) “活动 列表 =(TI(INCJ,T20C), T3(NC))。 
5. CW, 3,C, 4, 6) UNDO; C=4。 
6. (CW, 3, A, 1, 4) UNDO: A=I。 


7. (58, 3) 活动 列表 =(TI(NC), T2C))。 
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8.(W, 1, B, 2, 3) UNDO: B=2,。 

9.(S, 1) 活动 列表 =(T2(C))， 只 剩 下 已 经 握 交 的 ，ROLLBACK 结 
东 。 

Roll 和 rward( 跳 到 检查 点 后 的 第 一 个 日 志 项 ) 

10.(S, 4) 无 动作 。 活 动 的 已 提交 事务 T2.。 

11.(W, 2, E, 8, 9) REDO:，E=9。 

12.(C, 2) 无 动作 。 没 有 其 他 活动 的 已 提交 事务 。ROLL 
FORWARD 结 束 。 


(i111) 





10.9 ”首先 我 们 说 明 为 什么 这 些 都 基 事 务 持 续 可 能 出 现 的 情况 。 每 一 个 事务 必须 开始 和 结 
束 ， 开 始 必 须 在 结束 之 前 ， 且 开始 的 时 间 有 三 种 可 能 ; (1) 在 最 后 的 检查 点 发 生 之 前 (在 下 -~ 
个 习题 中 ， 我 们 将 说 明 如 果 在 两 个 检查 点 之 前 开始 也 不 会 有 任何 区 别 ) ; (2) 在 最 后 的 检查 点 
之 后 ， 但 是 在 崩溃 之 前 ; (3 在 山名 时 【在 此 时 刻 至 少 可 能 发 生 一 个 停止 动作 )。 所 以 ， 看 上 去 
所 有 可 能 的 开始 一 停 目 时 刻 集合 似乎 为 {1-1)、(1-2)、(1-3)、(2-2)、(2-3) 和 (3-3)。 但 是 事实 上 
(3-3) 是 本 可 能 的 ， 而 每 一 种 其 他 情况 按 序 都 被 事务 T, 到 T: 之 一 所 覆盖 。 

现在 我 们 说 明 每 一 种 情况 都 能 被 具有 高 速 缓存 一 致 性 检查 点 的 恢复 过 程 恢复 。 

(1 事务 的 开始 和 结束 都 在 最 后 的 检查 点 发 生 之 前 发 生 。 在 恢复 时 ， 我 们 并 不 对 这 些 数 据 项 进行 任 
何 UNDO 和 REDO。 这 是 因为 事务 在 进行 检查 点 时 已 经 不 是 活动 的 了 ， 所 以 在 检查 点 之 后 没有 发 生 写 操 
作 。 事实 上 ,该 事务 的 所 有 更 新 操作 都 在 最 后 的 检查 点 之 前 发 生 ， 而 检查 点 强制 所 有 的 “有 峙 ”数据 项 写 
人 和 磁盘。 这 样 ， 该 事务 的 所 有 更 新 都 已 经 被 换 出 到 磁盘 上 ， 于 是 我 们 在 恢复 时 不 用 对 它们 做 任何 修改 。 

(1.2)} 事 务 在 最 后 一 个 检查 点 之 前 开始 ， 但 是 在 它 之 后 结束 。 注 意 在 ROLLBACK 时 ， 我 们 
首先 看 到 提交 日 志 项 ， 所 以 在 ROLL FORWARD 之 前 对 写 日 志 不 进行 任何 动作 。 在 ROLL 
FORWARD 时 ， 从 检查 点 之 后 开始 , 我 们 REDO 该 事务 的 所 有 对 在 磁盘 上 的 数据 项 的 与 月 志 项 。 
在 检查 点 之 前 发 生 的 更 新 都 已 经 被 写 出 到 磁 稚 。 

(1-3) 事 务 在 最 后 一 个 检查 点 之 前 开始 ， 并 由 于 崩溃 而 结束 。 册 于 训 务 被 异常 终止 ,我们 
应 该 UNDO 它 执行 的 所 有 写 操作 。 注 意 ， 在 ROLLBACK 时 ， 我 们 --- 开 始 或 者 先 看 到 一 个 写 日 
志 ( 且 不 是 Commit )， 或 者 先 着 到 最 后 一 个 检查 点 的 时 间 ， 且 此 时 该 事务 供 然 是 活动 的 (日 
由 于 我 们 没有 看 到 Commit 日 志 ， 该 事务 仍 未 被 提交 )。 我 们 必须 UNDO 该 事务 的 所 有 写 项 。 
如 果 有 一 个 写 吕 志 项 在 最 后 一 个 检查 点 之 后 发 生 ， 我 们 马上 知道 这 是 一 个 未 提交 的 事务 ， 而 
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日 能 够 UNDO 该 日 志 项 的 动作 。 如 果 该 事务 在 检查 点 之 后 没有 和 留 下 任何 写 日 志 项 ， 我 们 仍然 
知道 在 检查 点 时 它 是 医 动 的 ， 所 以 可 以 继续 ROLLSACK 直 到 我 们 看 介 事 务 的 Start HH 志 为 止 ， 
将 对 所 有 的 写 日 志 进 行 UNDO ， 直 到 回 到 那 一 点 。 

(2-2) 事 涩 在 最 后 一 个 检查 点 之 后 开始 ， 并 在 它 之 后 结束 。 注 意 ， 在 ROLLBACK 时 ， 我 们 先 看 
网 Commit 日 志 项 ， 所 以 在 ROLL FORWARD 之 前 对 写 日 志 不 进行 任何 动作 。 在 ROLL FORWARD 时 ， 
从 检查 点 之 后 开始 ， 我 们 REDO 该 事务 对 在 磁盘 上 的 数据 项 的 所 有 的 写 日 志 项 。 这 正 是 所 期 望 的 。 

(2-3) 事 务 在 最 后 一 个 检查 点 之 后 开始 ， 并 由 于 骨 湾 而 结束 。 由 于 事务 异常 终止 ， 我 们 必 
须 UNDO 它 所 进行 的 所 有 写 操 作 。 注 意 在 ROLLBACK 时 ， 我 们 首先 会 看 到 一 个 写 日 志 (是 不 
是 Commit )， 叉 由 于 我 们 没有 看 到 Commit 日 志 ， 所 以 该 事务 没有 被 提交 .。 当 我 们 看 到 一 个 写 
日 志 项 的 时 候 ， 我 们 马上 知道 这 是 一 个 未 提交 的 事务 ， 并 可 以 UNDO 该 日 志 项 以 及 所 有 其 他 
写 日 志 项 的 动作 直到 Start 日 志 为 止 。 

最 后 还 有 -一 点 要 考 虚 。 我 们 是否 会 对 同一 个 数据 项 进行 不 同 的 动作 UNDO-UNDO、UNDO- 
REDO 或 REDO-REDO， 从 而 相互 影响 ， 导 致 最 后 存在 错误 的 数据 项 ? 我 们 首先 考虑 进行 UNDO 
操作 ,我们 知道 该 活动 是 由 于 事务 对 数据 项 的 更 新 没有 完成 ， 必 须 异 党 终止， 从 而 在 回 滚 时 进行 
的 。 通 过 锁 机 制 ， 如 果 我 们 假设 我 们 持 有 所 有 镇 直到 提交 为 止 ， 我们 知道 在 其 后 的 某 个 时 间 点 没 
有 其 他 事务 对 该 数据 项 进行 了 更 新 。 凑 他 UNDO 操 作 只 可 能 是 由 同一 个 事务 引起 的 ， 并 最 终 会 把 
值 设 为 该 事务 最 早 所 见 的 值 。 将 来 对 该 数据 项 的 REDO 操 作 ( 如 果 有 的 话 ) 必定 发 生得 更 尽 ， 而 
且 显 然 最 后 的 REDO 动 作 ( 如 果 有 的 话 ) 将 设置 和 最 早 的 UNDO 操 作 所 设 的 相同 的 值 。 所 以 所 有 
已 提交 的 事务 已 经 完成 了 它们 对 该 数据 项 的 更 新 【 仅 有 一 个 )， 而 任何 未 提交 事务 对 它们 没有 任 
何必 用 。 如 果 我 们 考虑 首先 进行 REDO 动 作 ， 通 过 锁 机 制 我们 知道 不 会 有 更 时 的 UNDO 动 作 ， 所 
以 最 终 的 REDO 操 作 设 置 了 最 终 的 值 。 我 们 根据 锁 原 则 下 的 经 历 的 可 串 行 性 知道 这 是 正确 的 值 。 

10.11 H= WATRIaATC WB) RAB) WO) RCIC WD) RD) CC C， 

TT TA oT, TT, TT, 
PGUH) = TT Te rT oT, 

因此 ，PG(H) 不 包含 环 ， 根 据 定理 10.3.4 可 知 H 是 可 只 行 化 的 。 等 价 的 串 行 经 历 S(H) 为 ; 

WAD) C; WAD) C WB) RAC) CWAA) RAB) GC RA(A) GC, 

( 注意 , 锁 机 制 将 把 T,， 然 后 是 T,、T,; 以 及 T; 转 入 等 待 状态 , 所 以 在 C; 时 ， 仅 有 Tj; 是 活动 的 ， 
它 将 释放 T,， 依 此 类 推 。) 


第 11 章 习题 解答 


11.1 (a) 错 。 主 锁 表 和 主事 务 表 可 以 在 共享 内 存 中 ， 所 以 锁 和 事务 状态 是 系统 范围 同步 

的 ,并且 不 需要 两 阶段 提交 。 

(b) 对。 假设 查询 仅 需 要 读 锁 。 其 他 只 读 的 进程 就 不 需要 等 符 这 些 锁 。 

(c) 错 。 服 务 器 可 以 通过 到 不 同 处 理 器 的 消息 来 实现 一 个 服务 。 

(d) 对。 一 个 60MIPS 的 CPU 将 对 应 于 图 11-6 中 的 一 个 点 ， 而 300MIPS 的 CPU 将 对 应 
王 水 平 轴 方 向 五 倍 远 的 一 个 点 。 五 个 60MIPS 的 CPU 将 成 为 在 原点 到 第 一 个 总 
的 射线 上 的 一 个 点 ， 该 射线 扩展 到 300MIPS 的 标记 为 止 。 由 于 该 曲线 越 来 越 向 
上 弯 ，300MIPS 的 CPU 将 更 高 一 些 。 

(e】 对 。 参 见 图 11-9， 前 省 状 态 反 馈 进 入 准备 状态 。 
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《编译 原理 及 实践 》 

《UNIX 环 境 高 蛆 编 程 良 

# 分 布 式 操作 系统 : 概 合 与 实践 》 

攻 分 布 式 系统 设计 多 

《现代 操作 条 统 》 
《UNTIX 操 恬 系 统 设计 》 
$UNIX 编 程 环境 

$C 语言 解析 》( 原 书 第 4 版 ) 

《人 局 程 序 接口 与 实现 》 

《 妇 程 序 讶 计 教 程 $( 原 书 第 2 版 ) 

和 C++ 程序 设计 教程 训 ( 原 书 第 2 版 ) 

和 编码 的 奥秘 放 

各 编码 的 奥秘 小 ( 原 书 第 2 版 ) 

& 人 ++ 核 心 : 欣 件 工程 疡 法 六 

& Java 程序 证 计 导 引 诈 

&Java 语言 解 条 记 

&Java 程序 设计 教程 让 ( 原 书 第 3 版 ) 

世 大 型 C++ 软件 设计 四 

C++ 语 言 的 设计 和 演化 训 

C++ 编程 思 粗 》 

于 C++ 编程 思想 上 ( 原 书 第 2 版 ) 

攻 Java 编 程 思 栖 少 

& Java 编 程 思想 四 【 原 书 第 2 版 } 

《电子 商务 

《多 媒体 应 用 程序 的 面向 对 介 设 计 》 
计算 机 文化 训 t 上原 书 第 3 版 】 
《图 论 导 引 》( 原 书 第 2 版 ) 

《专家 系统 原理 与 编程 $ ( 原 书 第 3 版 } 
神经 网 阁 》 

《人 机 接口 记 

设计 模式 :; 可 复 用 面向 对 章 软 忻 的 基础 记 
才 软 件 工 程 : JAVA 语言 实现 ?{ 睫 书 第 4 版 ) 
e 软 件 工 程 : 实践 者 的 研究 方法 多 ( 原 书 第 4 版 ) 
软件 需求 

《数据 库 系统 导论 外 原 书 第 7 版 ) 
数据 合 库 1{ 原 书 第 2 版 } 

米 据 挖 气 : 概念 与 技术 放 
数据库 系 统 概念 放 ( 原 书 第 3 版 ) 
《数据 库 系 统 实 现 》 


Louden 著 / 汉 博 学 等 译 /39.00 元 ， 
Stevens 沙 / 龙 晋 元 等 译 155,00 元 

Galli 著 / 尤 晋 元 等 译 / 

Jie Wu 车/ 而 传 关 等 译 /30.00 元 
Tanenbaum 著 / 陈 向 群 等 译 /40.00 元 
Bach 著 / 陈 欲 迁 等 译 /93.00 元 ， 
Kemighan 等 著 / 陈 向 群 等 译 /24.00 元 
Pohi 著 / 麻 志 胡 等 主 / 

Hanson 著 / 

Deitel 等 善 / 苹 万 鸯 等 译 /33.00 元 
Deitel 等 著 / 其 万 驶 等 译 /22.00 元 
Petzold 著 / 陆 丽 妈 等 详 /24.00 元 
Petzold 闭 / 陆 丽 寸 等 译 / 

Shtem 蔷 / 李 师 贤 等 译 / 

Liang 善 / 王 说 等 评 / 

Pohl 著 / 

Deitel 著 / 表 光山 等 译 / 

Lakos 著 / 李 师 贤 等 译 7 

Stroustrup 著 / 开 宗 菠 译 / 

Eckel 著 / 刘 宗 田 等 译 /39.00 元 
Eckel 著 / 刘 宗 本 等 译 / 

Eckel 著 / 京 京 工作 室 译 /39.00 元 
Eckel 着 / 京 京 工作 室 译 / 

Schneider 等 善 /成 林 译 /28.00 元 
Guzdial 落 / 

Parsons 著 / 朱 海滨 等 译 /50.00 元 

West 落 / 

Giarratano 着/ 印鉴 等 译 /49.00 元 
Haykin 著 / 杰 中 秆 等 译 / 

Raskin 著 / 

Gamma 等 著 / 吕 建 等 译 /35.00 元 
Schach 著 / 训 光山 等 主 /138.00 元 
Pressman 著 / 鞭 柏 束 、 梅 宏 译 /48.00 元 
Wiegers 著 / 陆 丽 杂 等 译 /19.00 元 

Date 闭 / 下 小 时 等 译 j66.00 元 

Inmon 着 / 王 志 海 等 译 几 5.00 元 

Jiawei Han 等 著 / 范 明 等 译 /39.00 元 
Silberschatz 等 著 / 杨 冬青 等 译 /49.00 元 
Grarcia-Molina 等 著 / 声 冬青 等 译 145.00 元 





有 数据 库 设计 多 
《数据 库 管理 系统 基础 多 
《事务 处 理 : 概念 与 技术 》 
“数字 还 加 应 用 与 设计 站 

要 败 入 式 计算 机 系统 设计 原理 

《并 行程 序 设计 有 

最 新 网 络 技 术 基 础 》 

《计算 机 网 络 与 因特网 》( 原 书 第 2 版 】 
“计算 机 网 阁 》( 原 书 第 2 版 ) 
光纤 通 以 技术 

高 性 能 适 信 网 络 》[ 原 书 第 2 版 ) 
《数据 通信 与 网 络 》 
《ISDN、B-ISDN 与 帧 中 继 和 A 六 TMfY》( 原 书 第 4 版 ) 
《计算 机 网 结实 用 教程 》 

有 计算 机 网 络 实用 教程 实验 手册 》 
《网 络 良 (兵书 第 2 版 ) 

$TCP/AP 详 解 着 1: 协议 》 
4$TCPAP 详 解 着 2: 实现 记 
《TCPAIP 详 解 着 3: TCP 事 务 协 议 、HTTP、 
NNTP 和 UNIX 域 协议 》 
Intemet 技 术 基 础 襄 ( 原 书 第 2 版 ) 

4 教 据 通 局 与 网 络 教程 外 原 书 第 2 版 ) 
《 窗 玛 学 寻 引 小 
分布 计算 的 信息 安全 》 

计算 机 信息 处 理 让 (后 书 第 7 版 ) 
信息 系统 原理 (版 书 第 3 版 ) 


Stephens 等 著 / 何 玉河 等 译 /35.00 元 
Pratt 等 著 / 际 洪 毅 等 译 /20.00 元 


”Gary 等 著 / 亚 小峰 等 主 / 


Yarbrough 著 / 朱 海滨 等 译 /49.00 元 

Wolf 著 / 孙 五 芳 等 译 / 

Wilkinson 著 / 陆 骞 达 等 译 / 

Palmer 著 / 严 伟 译 /20.00 元 

Comer 著 / 徐 贤 中 等 译 140.00 元 

Peterson 年 著 / 叶 新 孝 等 主 /49.00 元 

Mynbaey 稳 善 / 问 时 寄 等 译 /40.00 元 

Walrand 等 著 / 光 美 林 等 主 ; 

Forouzan 等 著 / 潘 耸 等 评 ， 叶 时 沽 校 /48.00 元 
Stallings 着 / 程 时 端 等 译 /48.00 元 , 

Dean 著 / 网 华航 等 译 165.00 元 

Dean 着 /网 华航 等 译 715.00 元 

Ramteke 著 / 候 春 薄 等 译 / 

Stevens 着 ! 范 建华 等 译 ， 谢 希 仁 校 1 45.00 元 
WrightyStevens 著 / 陆 雪 营 等 译 ， 谢 希 仁 校订 8.00 元 
Stevens 著 / 胡 从 十 等 泽 ， 谢 希 夺 校 1 3500 元 


Comer 著 /7 训 北山 等 评 718.00 元 
Shay 著 / 南 传 善 等 译 M0.00 元 
Garrete 著 / 

Bnice 省/ 

Mandel 等 著 / 尤 晓 东 等 译 /38.00 元 
Stair 等 著 / 张 靖 等 主 /42.00 元 


国外 经 典 教材 


《编译 原理 》 

《Linux 操 作 系统 内 核实 习 多 

操作 系统 原理 与 实践 》( 原 书 第 2 版 ) 
《现代 操作 系统 $( 原 书 第 2 版 ) 
《C++ 程序 设计 语言 》( 原 书 第 3 版 ， 特 别 版 ) 
CC 程序 设计 语言 ( 原 书 第 2 版 ) 
专程 序 设计 实践 》 

《程序 设计 语言 : 概念 与 结 橙 #( 原 书 某 2 版 》 
《计算 理论 导 引 》 

到 离散 教学 及 其 应 用 #( 原 书 第 4 版 ) 

和 组 合 教 学 弘 原 书 第 3 版 ) 


Aho 著 / 李 建 中 等 译 / 

Nutt 著 / 陆 丽 妊 等 译 / 

Nutt 著 /万 在 元 等 译 / 

Tanenbaum 著 / 陈 向 群 等 译 / 
Stroustrup 著 / 吉宗 疙 评 / 
Kernighan/Ritchie 著 / 除 宝 文 等 译 /28,00 元 
KernighaniPike 羊 /类 宗 臣 评 /20.00 元 
Sethi 著 / 雪 宗 蔬 等 译 / 

Sipser 著 / 张 立 吊 等 译 /30.00 元 

Rosen 著 / 表 当头 等 评 / 

Brualdi 著 / 西 兰 刻 等 译 / 


和 人工 御 能 》 

《神经 网 络 设计 》 

《 园 件 工程 实践 者 的 研究 方法 》( 原 书 第 5 版 ) 
数据 结构 、 算 法 与 应 用 : Cr+ 语言 描述 

& 数 据 结 枸 与 算法 分 析 : Ci 语言 描述 上 ( 原 书 第 2 版 ) 
《数据 库 系 统 上 原理 3》{ 原 书 第 4 版 ) 
数据库 原 理 、 编 程 与 性 能 站 (上原 书 第 2 版 ) 

和 并行 计 算 机 体系 站 构 》 

和 站 机 化 计算 机 组 成 用 

可 扩展 并 行 计算 ! 技术 、 钻 构 与 编程 》 
《计算 机 图 形 学 的 算法 基础 》{ 原 书 第 2 版 ) 
数据 通信 与 网 络 让 ( 原 书 第 2 版 } 


Nilsson 著 / 郑 扣 根 等 译 130.00 元 
Hagan 等 著 / 戴 诸 等 译 / 

Pressiman 著 / 樟 寅 等 译 / 

Sahni 著 / 戴 蒜 等 译 /49.00 元 

Weiss 著 / 沿 国 香 等 译 / 

Siblerschatz 等 著 / 杨 冬青 等 译 / 

O 〇 ”Neil 等 著 / 周 做 英 等 译 / 
Culler/Singh /Gupta 善 /李晓明 等 译 / 
Tanenbaum 著 / 刘 卫 东 等 译 /46.00 元 
Hwang/Xu 著 / 陆 夸 达 等 译 /149.00 元 
Rogers 著 / 石 教 英 等 谋 / 

Forouzan 区 著 / 吴 时 淋 等 译 / 


经 典 原 版 书库 





《UNIX 环境 高 级 编程 了 》( 英文 版 ) 

二 现代 操作 系统 让 (英文 版 ， 第 2 版 ) 

程序 设计 语言 : 概念 与 结 柏 {英文 版 ' 第 2 版 ) 

CC 程序 设计 语言 了》( 英 区 版" 第 2 版 】 
C++ 语 言 的 设计 和 演化 训 ( 英文 版 ) 

人 程序 设计 实践 》{ 英文 版 ) 

“C++ 编程 思想 》( 英文 版 第 2 版 ) 

Java 编 程 电 想 》( 英文 版 第 2 版 ) 
《离散 数学 及 其 应 用 (英文 版 - 第 4 版 】 
组合 数学 上 (英吉 版 第 3 版 )】 

《人工 智能 了》( 英文 版 } 

“设计 模式 : 可 复 用 面向 对 象 软件 的 基础 上 英文 版 ) 
《软件 工程 ，Java 语 言 实现 了》[ 英文 版 * 第 4 版 ) 

软件 工程 : 实践 者 的 研究 方法 (英文 版 ， 第 4 版 】 
系统 分 析 与 设计 让 { 英 区 版 】 

《数据 结构 、 算 法 与 应 用 一 一 C++ 语 言 描述 (英文 版 ) 
邢 据 库 系 统 导 论 ( 英文 版 :第 7 版 )】 

# 数据 库 系统 概念 (英文 版 第 3 版 ) 

# 数据 库 系 统 实现 少 ( 英文 版 ) 

攻 高 组 计算 机 体系 结构 #{ 英文 版 ) 

计算 和 体系 结构 和 醒 化 研究 方法 》{ 英文 版 + 第 2 版 ) 
用 计算机 组 织 和 设计 : 硬 余 /软件 方法 让 (英文 版 :第 2 版 } 
并行 计 算 机 体系 结构 》( 英文 版 ， 第 2 版 ) 

可 护 宕 并 行 计 算 : 技术 、 闭 构 与 编程 训 { 美式 版 ) 
结构 化 计算 机 组 成 上 (英文 版 ， 第 4 版 ) 


Stevens 著 / 

Tanenbaum 车/ 

Sethi 著 / 

Kemighan/Ritchie 著 / 
Stroupstrup 著 / 
Kemighan/Pike 著 / 

Eckel 著 / 

Eckel 省 7 

Rosen 著 /759.00 元 , 

Brualdi 著 / 

Nilsson 著 /45.00 元 
Gamma/Helm/Johnson/Vlissides 着/ 
Schach 闭 51.00 元 

Pressman 著 168.00 元 
Satzinger/Jackson 著 /60.00 元 
Sahni 沙 166.00 元 

Date 落 / 
Silberschatz/Korth/Sudarshan 著 165.00 元 
MolinayUihnarnwidom 著 / 
Hwang 着/59.00 元 
Patterson/Hennessy 著 /88.00 元 
Hennessy/Patterson 车 /80.00 元 
CullerSinghAGupta 着 /88.00 元 
Hwang/Xu 著 /69.00 元 
Tanenbaum 著 / 


计算 机 图 形 学 的 算法 基础 》( 英文 版 ,第 2 版 】 
通信 网 络 基 础 (英文 版 :第 2 版 ) 

站 计算 机 网 络 放 (英文 版 第 2 版 ) 

各 南 性 能 通信 网 络 消 (英文 版 第 2 版 ) 

《网络 互 连 ; 网 酉 .政和 由 器 .交换 机 和 豆 连 协议 》 
{ 英 立 版 : 第 2 版 】 

数据 通 己 与 网 络 让 (英文 版 》 

《ISDN、B-ISDN 与 帧 中 继 和 ATM》( 英 详 版 ' 第 4 版 】 
《TCPIIP 详 解 卷 1; 协议 了》( 英 诡 版 ) 

¢《 TCP/IP 详解 春 2: 实现》( 英文 版 ) 
《TCPAP 详 解 卷 3: TCP 事 务 协 议 、HTTP、 
NNTPE 和 UNIX 域 协议 让 ( 英文 版 ) 
《Intemet 技 术 基 础 了》( 英文 版 : 第 3 版 )】 


Rogers 等 著 / 

Walrand 著 /32.00 元 
Peterson/Davie 若 /65.00 元 
Walrand/Varaiya 著 /64.00 元 
Perjman 著 / 


Forouzan 等 著 /59.00 元 
Stallings 著 / 

Stevens 落 / 
WrighwStevens 著 / 
Stevens 著 / 


Comer 著 / 
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